当前位置: 首页 > wzjs >正文

深圳网站建设公司排行重庆排名seo公司

深圳网站建设公司排行,重庆排名seo公司,动态网站开发技术及其特点,地方性小网站的建设spark-submit工具的使用及常见的参数 spark-submit 是在spark安装目录中bin目录下的一个shell脚本文件,用于在集群中启动应用程序(如*.jar、*.py脚本等);对于spark支持的集群模式,spark-submit提交应用的时候有统一的…

spark-submit工具的使用及常见的参数

spark-submit 是在spark安装目录中bin目录下的一个shell脚本文件,用于在集群中启动应用程序(如*.jar、*.py脚本等);对于spark支持的集群模式,spark-submit提交应用的时候有统一的接口,不用太多的设置。

spark-submit是使用spark开发的程序员可能用到的最多的工具之一,该命令涉及到非常多的参数,这里只罗列企业中用的最多的最常用的参数,其他的一些特殊的参数可以参照官网或者相关文档查阅。

--master

该参数表示提交任务到哪里执行,常见的选项有:

local:提交到本地服务器执行,并分配单个线程

local[k]:提交到本地服务器执行,并分配k个线程

local[*]:提交到本地服务器执行,并分配本地core个数个线程

spark://HOST:PORT:提交到standalone模式部署的spark集群中,并指定主节点的IP与端口

mesos://HOST:PORT:提交到mesos模式部署的集群中,并指定主节点的IP与端口

yarn:提交到yarn模式部署的集群中

 --deploy-mode

spark on yarn的两种启动方式,区别是spark的driver是在本地 (client) 启动还是在yarn的container中启动,默认是 client

 --class

应用程序的主类,仅针对 java 或 scala 应用

 --name

指定应用程序的名称,在yarn调度系统下,只对cluster模式生效

 --jar

用逗号分隔的本地 jar 包,设置后,这些 jar 将包含在 driver 和 executor 的 classpath 下。如果路径是个目录的话,--jars的设置无法起作用,必须详细到abc.jar。

备注:区别spark-defaults.conf配置文件中的spark.yarn.jars

--jars:主要用于上传我们需要的第三方依赖

spark.yarn.jars:主要传入spark环境相关的jar包,例如 spark.core,spark.sql等等

 --conf prop=value

指定spark配置属性的值,格式为PROP=VALUE, 例如 --conf spark.executor.extraJavaOptions=“-XX:MaxPermSize=256m”

 --properties-file

指定需要额外加载的配置文件,用逗号分隔,如果不指定,默认为 conf/spark-defaults.conf

--driver-memory和--driver-core

前者表示driver内存,默认 1G;后者表示driver 的核数,默认是1。在 yarn 或者 standalone 下使用

建议:对于driver memory通常不用设置,若出现使用 collect 算子将 RDD 数据全部拉取到 Driver 上处理,就必须确保该值足够大,否则 OOM 内存溢出(如果设置了广播变量再设置大一点)。

 --num-executors

启动的 executor 数量,即该作业总共需要多少executor进程执行,默认为2。建议:每个作业运行一般设置5,10,20个左右较合适。在 yarn 下使用

 --executor-memory和--executor-cores

executor-memory:设置每个executor进程的内存, num-executors * executor-memory  代表作业申请的总内存量(尽量不要超过最大总内存的1/3~1/2)

建议:设置5G~10G较合适

executor-cores:每个executor进程的CPU Core数量,该参数决定每个 executor进程并行执行task线程的能力, num-executors* executor-cores代表作业申请总 CPU core数(不要超过总 CPU Core的 1/3~1/2 )

建议:设置2~4个比较合适

 --queue QUEUE_NAME

将任务提交给哪个YARN队列,默认为YARN的默认队列

提交实例

使用spark自带的圆周率案例进行测试


# local
bin/spark-submit --class org.apache.spark.examples.SparkPi --master local ./examples/jars/spark-examples_2.12-3.2.0.jar 200#yarn client
bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn --deploy-mode client ./examples/jars/spark-examples_2.12-3.2.0.jar 200#yarn cluster
bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn --deploy-mode cluster ./examples/jars/spark-examples_2.12-3.2.0.jar 200

备注1:200表示要运行程序的输入参数(计算圆周率π的次数,计算次数越多,准确率越高),如果不指定默认是2

http://www.dtcms.com/wzjs/2644.html

相关文章:

  • 网站建设与管理专业找暑假工网络营销的主要内容包括
  • 做简历的网站有seo优化在线
  • 企业网站建设费用价格关键词排名查询网站
  • 去哪里做网站seo网站优化案例
  • 做哪些网站比较好成都建设网官网
  • 网络营销fab是什么苏州seo关键词优化外包
  • 山东网站建设写软文怎么接单子
  • 如何自己做软件网站数据分析培训
  • 怎么下载别人网站模板免费推广平台哪些比较好
  • 支付宝支持12306网站建设宁德市自然资源局
  • 对网站开发的理解媒体发稿平台
  • 网站标题怎么隔开北京、广州最新发布
  • 淘宝客网站可以做分销吗百度查重
  • 武汉手机网站建设价位百度的网址是什么
  • 社交移动电子商务平台有哪些aso优化服务
  • 北京公司注册在哪个网站灰色seo推广
  • 做网站的时候表格怎么去掉网络营销推广计划
  • 酒类销售公司的网站建设学企业管理培训班
  • 如何做类似千图网的网站济南优化seo公司
  • 宣讲家网站 政治建设排名seo公司
  • 四大门户网站现状数字营销
  • 政府网站建设 绩效考核4%搜狗网址大全
  • 做商城网站那个好免费的域名和网站
  • 手机零售网站 关键词百度产品有哪些
  • 网站营销建设方案百度网盘下载速度
  • 建设网站设计营销神器
  • 做心悦腾龙光环的网站如何引流与推广
  • 百度网站下拉怎么做推广赚佣金项目
  • 做幼儿园成长册的素材网站百度推广账号登录
  • 企业品牌网站建设公司推广引流吸引人的文案