当前位置: 首页 > wzjs >正文

网站建1设公司免费制作网页平台

网站建1设公司,免费制作网页平台,上海工作室,网站及建设中页面python文件在spark集群运行真的麻烦,烦冗 spark运行分为了三个模式,本地模式/client模式/cluster模式 文章目录 本地模式client模式cluster模式参考 本地模式 现在的spark支持python3了,支持python2的版本已经很落后了,所以需要…

python文件在spark集群运行真的麻烦,烦冗

spark运行分为了三个模式,本地模式/client模式/cluster模式

文章目录

  • 本地模式
  • client模式
  • cluster模式
  • 参考

本地模式

现在的spark支持python3了,支持python2的版本已经很落后了,所以需要使用python3来弄,本地模式只要可以运行python xx.py,spark-submit就可以

spark-submit \
local [*] \
--conf spark.pyspark.python=/usr/bin/python3 \
--conf spark.pyspark.driver.python=/usr/bin/python3 \
xx.py

/usr/bin/python3 替换为本地python解释器绝对路径就行。

xx.py 所依赖的库什么的,直接就在本地装就可以了,如果是不联网机器,可以在有网络的环境里,把依赖的库下载好,再传到不联网机器安装就行。就是一个pip downloadpip install的操作。

client模式

client模式和cluster模式比较麻烦了,需要把所依赖的python环境上传,不推荐--py-files,太麻烦了,得弄多少zip包,用--archives这个参数就行,上传python环境,推荐用conda创建环境,然后再用conda打包就行。

就是考察对anaconda命令得熟悉。

conda create -y -n pyspark_conda_env -c conda-forge pyarrow pandas conda-pack
conda activate pyspark_conda_env
conda pack -f -o pyspark_conda_env.tar.gz

还需要把 pyspark_conda_env.tar.gz 给上传到hdfs上面。

hdfs dfs -put pyspark_conda_env.tar.gz /user/hadoop/data/

还有一点,需要把xx.py也上传

hdfs dfs -put xx.py /user/hadoop/data/

上传完了,需要在本地解压pyspark_conda_env.tar.gz,命令参数有用。

最后spark-submit如下

spark-submit \
--master yarn \
--deploy-mode client \
--archives 本地路径/pyspark_conda_env.tar.gz#environment
--conf spark.pyspark.python=./environment/bin/python \
--conf spark.pyspark.driver.python=本地解压路径/pyspark_conda_env/bin/python \
hdfs://user/hadoop/data/xx.py

其中要注意的是 #environment 的写法就可以把前面一长串给代表了,下面就可以用#后面的字符来代表了

--archives 本地路径/pyspark_conda_env.tar.gz#environment

cluster模式

只要跑通了client模式,cluster就简单多了,不用在本地解压pyspark_conda_env.tar.gz这个包了,就直接用了。

spark-submit \
--master yarn \
--deploy-mode cluster \
--archives 本地路径/pyspark_conda_env.tar.gz#environment
--conf spark.pyspark.python=./environment/bin/python \
hdfs://user/hadoop/data/xx.py

参考

在PySpark程序中使用Conda打包Python环境及第三方库
官网教程

http://www.dtcms.com/wzjs/19859.html

相关文章:

  • 找人 做网站 一般注意潍坊网站收录
  • 在哪些网站做推广比较好如何创建自己的网址
  • 辽源网站seo世界十大网站排名出炉
  • 培训教育学校的网站建设方案武汉服装seo整站优化方案
  • pc 网站建设青岛网页搜索排名提升
  • 在线客服接入网站腾讯企点怎么注册
  • 域名注册商推荐沈阳网站seo公司
  • 下载网站建设自媒体运营
  • 鞍山市建设工程安全生产监督管理站网站100个裂变营销案例
  • 天津网站建设培训seo外链工具
  • 淄博网上商城制作简述seo和sem的区别与联系
  • 怎么刷网站权重网站推广入口
  • asp网站开发pdf广州最近爆发什么病毒
  • wordpress全站开启ssl辽宁网站建设
  • 网站开发的形式是百度开户资质
  • 企业彩铃制作网站如何做好网络营销
  • 引航博景做的网站网络推广是啥
  • 业务网站制作全网营销国际系统
  • 临颖网站建设湘潭关键词优化公司
  • 免费信息网站建设发布信息的免费平台
  • 沈阳网站建站公司百度快照替代
  • 网络广告的特点是seo网站推广建站服务商
  • 网站只有一个首页单页面怎么做排名新闻软文发稿平台
  • 网站建设 上市公司艾滋病多久能检查出来
  • 做网站软件流程竞价排名采用什么计费方式
  • wordpress 标签云集站长工具seo源码
  • 做谷歌网站英文网站设计公司
  • 东莞市官网网站建设价格app推广多少钱一单
  • 深圳专业做网站多少钱磁力吧最佳搜索引擎
  • 万户网络做网站很垃圾许昌正规网站优化公司