当前位置: 首页 > wzjs >正文

网站建1设公司自媒体运营主要做什么

网站建1设公司,自媒体运营主要做什么,哈尔滨网站建设制作价格,临朐在线网站建设python文件在spark集群运行真的麻烦,烦冗 spark运行分为了三个模式,本地模式/client模式/cluster模式 文章目录 本地模式client模式cluster模式参考 本地模式 现在的spark支持python3了,支持python2的版本已经很落后了,所以需要…

python文件在spark集群运行真的麻烦,烦冗

spark运行分为了三个模式,本地模式/client模式/cluster模式

文章目录

  • 本地模式
  • client模式
  • cluster模式
  • 参考

本地模式

现在的spark支持python3了,支持python2的版本已经很落后了,所以需要使用python3来弄,本地模式只要可以运行python xx.py,spark-submit就可以

spark-submit \
local [*] \
--conf spark.pyspark.python=/usr/bin/python3 \
--conf spark.pyspark.driver.python=/usr/bin/python3 \
xx.py

/usr/bin/python3 替换为本地python解释器绝对路径就行。

xx.py 所依赖的库什么的,直接就在本地装就可以了,如果是不联网机器,可以在有网络的环境里,把依赖的库下载好,再传到不联网机器安装就行。就是一个pip downloadpip install的操作。

client模式

client模式和cluster模式比较麻烦了,需要把所依赖的python环境上传,不推荐--py-files,太麻烦了,得弄多少zip包,用--archives这个参数就行,上传python环境,推荐用conda创建环境,然后再用conda打包就行。

就是考察对anaconda命令得熟悉。

conda create -y -n pyspark_conda_env -c conda-forge pyarrow pandas conda-pack
conda activate pyspark_conda_env
conda pack -f -o pyspark_conda_env.tar.gz

还需要把 pyspark_conda_env.tar.gz 给上传到hdfs上面。

hdfs dfs -put pyspark_conda_env.tar.gz /user/hadoop/data/

还有一点,需要把xx.py也上传

hdfs dfs -put xx.py /user/hadoop/data/

上传完了,需要在本地解压pyspark_conda_env.tar.gz,命令参数有用。

最后spark-submit如下

spark-submit \
--master yarn \
--deploy-mode client \
--archives 本地路径/pyspark_conda_env.tar.gz#environment
--conf spark.pyspark.python=./environment/bin/python \
--conf spark.pyspark.driver.python=本地解压路径/pyspark_conda_env/bin/python \
hdfs://user/hadoop/data/xx.py

其中要注意的是 #environment 的写法就可以把前面一长串给代表了,下面就可以用#后面的字符来代表了

--archives 本地路径/pyspark_conda_env.tar.gz#environment

cluster模式

只要跑通了client模式,cluster就简单多了,不用在本地解压pyspark_conda_env.tar.gz这个包了,就直接用了。

spark-submit \
--master yarn \
--deploy-mode cluster \
--archives 本地路径/pyspark_conda_env.tar.gz#environment
--conf spark.pyspark.python=./environment/bin/python \
hdfs://user/hadoop/data/xx.py

参考

在PySpark程序中使用Conda打包Python环境及第三方库
官网教程

http://www.dtcms.com/wzjs/81626.html

相关文章:

  • 猪八戒网做网站怎么样便宜的seo网络营销推广
  • 网站域名是啥郑州网站推广优化公司
  • wordpress图片上传后无法显示seo优化方法网站快速排名推广渠道
  • 公司注册资金最低多少什么是seo是什么意思
  • 现在个人做网站还能盈利吗百度网站排名查询
  • 最简单的软件开发工具手机优化游戏性能的软件
  • 北京搬家公司口碑排行电话深圳优化公司样高粱seo
  • 青岛菜西有做网站的吗百度推广费用一年多少钱
  • 网站开发的目的实习报告免费个人网站源码
  • 网页微博登录入口上海哪家seo公司好
  • 给企业开发网站自己搭建一个网站
  • 有没有哪个做美食的网站seo职位招聘
  • 芜湖网站建设哪家好手游免费0加盟代理
  • wordpress怎么开发文档windows优化大师是官方的吗
  • 番禺网站建设培训查图百度识图
  • 公众号自己做电影网站自助友链平台
  • 化工行业网站模板软文网官网
  • 沈阳网站建设思路网站排名top排行榜
  • 贵阳做网站需要多少钱做微商如何引流推广怎么找客源
  • 英文网站模版沈阳seo网站推广
  • 嘉兴网页制作网站排名大数据营销精准营销
  • 定制型网站建设服务源码时代培训机构官网
  • 我找别人做的网站现在不管了怎么办友情链接源码
  • 网站平台建设模板关键词百度网盘
  • 营销网站建设方案最有效的推广方法
  • 上海网站建设哪家便宜网站推广优化c重庆
  • 谁会在阿里云建网站宁波最好的推广平台
  • wordpress 如何切换主题旺道seo推广效果怎么样
  • 科技布沙发优缺点厦门seo代运营
  • 为什么要用模板建站?seo优化主要做什么