当前位置: 首页 > news >正文

Spark on yarn的作业提交流程

一、YarnClient
在这里插入图片描述

二、YarnCluster
在这里插入图片描述

三、详细描述

  • 客户端(Client)通过YARN的ResourceManager提交应用程序。在此过程中,客户端进行权限验证,生成Job
    ID和资源上传路径,并将这些信息返回给客户端。
  • 客户端将jar包、配置文件、第三方包等文件上传到指定的HDFS路径。完成后,客户端再次向ResourceManager提交作业执行请求。
  • ResourceManager收到请求后,将其封装为一个任务,并将其插入Scheduler的任务队列中,等待空闲资源。
  • 一旦集群中有空闲资源,Scheduler将任务分配给NodeManager,NodeManager创建容器,并启动ApplicationMaster。
  • ApplicationMaster启动后,从HDFS中拉取jar包,解析数据流(DAG),根据数据流生成阶段(Stage),确定任务的并发度,并向ResourceManager申请资源。
  • ResourceManager接收到请求后,将任务封装为Task,并将其插入任务队列。
  • 一旦集群中有空闲资源,ResourceManager将任务分配给NodeManager,NodeManager启动容器,并与ApplicationMaster通信,以在容器中启动Executor进程。
  • Executor向ApplicationMaster注册,并申请任务。ApplicationMaster对任务进行解析,并将Task发送到Executor上。
  • Executor执行Task,并将执行结果或状态报告给ApplicationMaster。
  • 当所有任务执行完毕时,ApplicationMaster通知ResourceManager注销应用,回收资源。至此,整个作业的提交流程结束。

相关文章:

  • AppInventor2原生进度条组件LinearProgress用法及注意点
  • 试过沃尔玛的无人机送货吗?今年覆盖范围将翻番
  • 傲火集团传媒基地武汉启幕 构建数字娱乐产业生态闭环
  • yolov5环境配置
  • 拉深工艺——有凸缘圆筒形件的拉深(实例分析)
  • slam--运动方程和观测方程
  • 【驱动设计的硬件基础】处理器的分类
  • 解决蓝牙MAC 地址倒序问题
  • 如何快速删除谷歌浏览器在mac启动台生成的网页图标
  • 从零开始学Python(3)——函数
  • python-76-基于uv的python虚拟环境和包管理工具
  • 基于大模型预测单纯性孔源性视网膜脱离的技术方案大纲
  • Makefile 学习笔记
  • AI大模型从0到1记录学习 大模型技术之机器学习 day27-day60
  • 介绍一下 TCP方式程序的通讯,服务器机与客户机
  • DeepSeek AI功能演示:如何生成Verilog脚本
  • 延时神经网络 vs CNN vs RNN:时空建模的三种武器对比
  • Java List操作与遍历全攻略
  • 【总天数两种算法相互印证正确】2022-4-13
  • spring-cloud-starter-alibaba-sidecar组件介绍
  • 网络公司网站图片/qq引流推广平台
  • 公司网站现状/北京百度关键词排名
  • 龙华营销型网站设计/武汉seo诊断
  • 怎么让做的网站赚钱吗/国外推广网站
  • 网站建设价格费用/360关键词推广
  • 黄页营销网站视频免费大全/免费关键词挖掘网站