当前位置: 首页 > news >正文

Spark提交任务

1、Spark提交任务到Yarn

1.1、DwKuduApp

spark-submit --class com.io.etl.dwkudu.DwKuduApp \
--files /etl/etl-dwkudu/conf/doris.property,/etl/etl-dwkudu/conf/redis.property,/etl/etl-dwkudu/conf/log4j.property \
--master yarn --deploy-mode cluster \
--driver-memory 2g \
--executor-memory 7g \
--conf "spark.executor.cores=2" \
--conf "spark.yarn.maxAppAttempts=0" \
--conf "spark.task.maxFailures=1" \
--conf "spark.dynamicAllocation.enabled=false" \
--conf "spark.executor.instances=8" \
--conf "spark.yarn.executor.memoryOverhead=1024m" \
--conf "spark.executor.extraJavaOptions=-Dlog4j.configration=log4j_dwkudu.properties -XX:+UseG1GC" \
--conf "spark.streaming.kafka.maxRatePerPartition=$datacount" \
/etl/etl-dw-kudu/etl-dw-kudu.jar $period > /etl-log/etl-dw-kudu/etl-dw-kudu.log

1.1、GateAppetl

spark-submit --class com.io.etl.gate.GateAppetl \
--files /etl/gate/conf/doris.property,/etl/gate/conf/redis.property,/etl/gate/conf/log4j.property \
--master yarn --deploy-mode cluster \
--driver-memory 600m \
--executor-memory 1g \
--conf "spark.executor.cores=1" \
--conf "spark.yarn.maxAppAttempts=0" \
--conf "spark.yarn.task.maxFailures=1" \
--conf "spark.dynamicAllocation.enabled=false" \
--conf "spark.executor.instances=8" \
--conf "spark.yarn.executor.memoryOverhead=1524m" \
--conf "spark.executor.extraJavaOptions=-Dlog4j.configuration=log4j_gate.properties -XX:+UseG1GC -verbose:gc -XX:PrintGCTimeStamps" \
--conf "spark.streaming.kafka.maxRatePerPartition=1000" \
/etl/etl-gate/etl-gate.jar 10 > /etl-log/etl-dw-kudu/etl-gate.log

1.1、PayKuDuIdApp

spark-submit --class com.io.etl.PayKuDuIdApp \
--files /etl/gate/conf/doris.property,/etl/gate/conf/redis.property,/etl/gate/conf/log4j.property \
--master yarn --deploy-mode cluster \
--driver-memory 2048m \
--executor-memory 4g \
--conf "spark.executor.cores=1" \
--conf "spark.yarn.maxAppAttempts=0" \
--conf "spark.yarn.task.maxFailures=1" \
--conf "spark.dynamicAllocation.enabled=false" \
--conf "spark.executor.instances=4" \
--conf "spark.yarn.executor.memoryOverhead=2048m" \
--conf "spark.driver.extraJavaOptions=-Dfileencoding=utf-8" \
--conf "spark.executor.extraJavaOptions=-Dlog4j.configuration=log4j_id.properties -Dfile.encoding=utf-8 -XX:+UseG1GC -verbose:gc -XX:PrintGCDetails +XX:+PrintGCTimeStamps" \
--conf "spark.streaming.kafka.maxRatePerPartition=12000" \
/etl/etl-id-kudu/etl-id-kudu.jar 2 3000 > /etl-log/etl-id-kudu/etl-id-kudu.log


相关文章:

  • Java中的常用类 --String
  • 备战蓝桥杯 -牛客
  • 全志A133 android10 适配SLM770A 4G模块
  • 编辑过程使用
  • 大模型高效注意力机制全解析:FlashAttention 与稀疏注意力实战
  • 14.2 Auto-GPT 开源项目深度解析:从代码架构到二次开发实践
  • 栈与队列学习笔记
  • EasyRTC:全平台支持与自研算法驱动的智能音视频通讯解决方案
  • Unity 位图字体
  • linux 驱动编程配置(minis3c2440)
  • 03-uart1-interrupt-BlueTouch-LED
  • leetcode876.链表的中间结点
  • 3.Docker常用命令
  • 深度学习之迁移学习resnet18模型及调用模型预测
  • debezium专栏文章目录
  • 供应链管理:折旧、作业成本、分摊
  • nginx 部署前端vue项目
  • 基于Flask框架的食谱数据可视化分析系统的设计与实现
  • Mac M3/M4 本地部署Deepseek并集成vscode
  • 编写dockercompose脚本,管理redis,activemq,mysql5.7
  • 中国通信建设协会网站/天天广告联盟
  • 做网站的最终目的/游戏优化是什么意思
  • 婚纱网站怎么做/互联网广告推广
  • 教人做辐射4mod的网站/免费收录网站
  • 潮州网站开发/湖南seo推广软件
  • wordpress 推荐环境/重庆seo排名软件