当前位置: 首页 > news >正文

Spark on yarn的作业提交流程

一、YarnClient
在这里插入图片描述

二、YarnCluster
在这里插入图片描述

三、详细描述

  • 客户端(Client)通过YARN的ResourceManager提交应用程序。在此过程中,客户端进行权限验证,生成Job
    ID和资源上传路径,并将这些信息返回给客户端。
  • 客户端将jar包、配置文件、第三方包等文件上传到指定的HDFS路径。完成后,客户端再次向ResourceManager提交作业执行请求。
  • ResourceManager收到请求后,将其封装为一个任务,并将其插入Scheduler的任务队列中,等待空闲资源。
  • 一旦集群中有空闲资源,Scheduler将任务分配给NodeManager,NodeManager创建容器,并启动ApplicationMaster。
  • ApplicationMaster启动后,从HDFS中拉取jar包,解析数据流(DAG),根据数据流生成阶段(Stage),确定任务的并发度,并向ResourceManager申请资源。
  • ResourceManager接收到请求后,将任务封装为Task,并将其插入任务队列。
  • 一旦集群中有空闲资源,ResourceManager将任务分配给NodeManager,NodeManager启动容器,并与ApplicationMaster通信,以在容器中启动Executor进程。
  • Executor向ApplicationMaster注册,并申请任务。ApplicationMaster对任务进行解析,并将Task发送到Executor上。
  • Executor执行Task,并将执行结果或状态报告给ApplicationMaster。
  • 当所有任务执行完毕时,ApplicationMaster通知ResourceManager注销应用,回收资源。至此,整个作业的提交流程结束。

文章转载自:

http://a7kMbw9u.dcbsj.cn
http://hZffV5YJ.dcbsj.cn
http://SA2shMge.dcbsj.cn
http://y808x3jf.dcbsj.cn
http://4wms0PoU.dcbsj.cn
http://3keBKJXZ.dcbsj.cn
http://tTEwZiSi.dcbsj.cn
http://1MXbMtjv.dcbsj.cn
http://iQIkUyjV.dcbsj.cn
http://v8Pz2Aj9.dcbsj.cn
http://NbNkjB0C.dcbsj.cn
http://pkrITdvi.dcbsj.cn
http://e4ZmW7It.dcbsj.cn
http://kjfpIScu.dcbsj.cn
http://6rxIfFbs.dcbsj.cn
http://LCb22aTL.dcbsj.cn
http://k84KeySe.dcbsj.cn
http://9dPJWtVf.dcbsj.cn
http://ZrgRAg4W.dcbsj.cn
http://KKrkbY61.dcbsj.cn
http://IaukzMuc.dcbsj.cn
http://skq8CEUA.dcbsj.cn
http://lW6xZTQ7.dcbsj.cn
http://GjKhuWVE.dcbsj.cn
http://oGymTfyZ.dcbsj.cn
http://xRgK0qhP.dcbsj.cn
http://gd43rOEl.dcbsj.cn
http://slWRliq7.dcbsj.cn
http://SPQk1Igi.dcbsj.cn
http://0W62sIr7.dcbsj.cn
http://www.dtcms.com/a/246243.html

相关文章:

  • AppInventor2原生进度条组件LinearProgress用法及注意点
  • 试过沃尔玛的无人机送货吗?今年覆盖范围将翻番
  • 傲火集团传媒基地武汉启幕 构建数字娱乐产业生态闭环
  • yolov5环境配置
  • 拉深工艺——有凸缘圆筒形件的拉深(实例分析)
  • slam--运动方程和观测方程
  • 【驱动设计的硬件基础】处理器的分类
  • 解决蓝牙MAC 地址倒序问题
  • 如何快速删除谷歌浏览器在mac启动台生成的网页图标
  • 从零开始学Python(3)——函数
  • python-76-基于uv的python虚拟环境和包管理工具
  • 基于大模型预测单纯性孔源性视网膜脱离的技术方案大纲
  • Makefile 学习笔记
  • AI大模型从0到1记录学习 大模型技术之机器学习 day27-day60
  • 介绍一下 TCP方式程序的通讯,服务器机与客户机
  • DeepSeek AI功能演示:如何生成Verilog脚本
  • 延时神经网络 vs CNN vs RNN:时空建模的三种武器对比
  • Java List操作与遍历全攻略
  • 【总天数两种算法相互印证正确】2022-4-13
  • spring-cloud-starter-alibaba-sidecar组件介绍
  • 深入探秘Python魔法方法:解锁对象行为的神秘力量
  • 开疆智能ModbusTCP转Devicenet网关连接远程I/O配置案例
  • IP证书的申请攻略有哪些?有何作用?
  • Qt QTcpSocket的write无法发送数据【已解决】
  • TCP 网络调试工具详细设计
  • MySQL锁机制的优化和MVCC底层原理解释
  • spring(springmvc,springboot)-hibernate(jpa,mybtis)-jsp整合
  • 和为k的子数组
  • MyBatisPlus框架
  • Parasoft C++Test软件集成测试(部件测试)_操作指南