当前位置: 首页 > wzjs >正文

无锡市住房建设局网站优化营商环境工作开展情况汇报

无锡市住房建设局网站,优化营商环境工作开展情况汇报,wordpress快速收录,购物网站建设精英Spark的通用运行流程 集群启动后Worker节点会向Master节点心跳汇报资源Client向Driver提交APP,根据不同的运行模式在不同的地方创建Driver。Driver以粗粒度的方式向Master注册应用并申请资源(在Application执行之前,将所有的资源申请完毕&…

Spark的通用运行流程

在这里插入图片描述

  1. 集群启动后Worker节点会向Master节点心跳汇报资源
  2. Client向Driver提交APP,根据不同的运行模式在不同的地方创建Driver。
  3. Driver以粗粒度的方式向Master注册应用并申请资源(在Application执行之前,将所有的资源申请完毕,当资源申请成功后,才会进行任务的调度,当所有的Task执行完成后,才会释放这部分资源。)(资源有Executer的CPU Core和Mem)
  4. Master根据SparkContext的资源申请情况以及Worker心跳周期内报告的信息决定在哪个Worker上分配资源,也就是Executer。
  5. Worker节点创建Executer进程,Executer向Driver反向注册。
  6. 资源满足后(Executer注册完毕)SparkContext解析代码,创建RDD,构建DAG,并提交给DAGScheduler分解成Stage(当碰到行动算子时,会催生job,每一个job有一个或多个Stage),然后Stage提交给TaskScheduler,TaskScheduler负责将Task分配给相应的Worker,最后提交Executer执行。
  7. 每个Executer会有一个线程池,Executer通过启动多个线程(Task)来对RDD的Partition进行并行计算,并向SparkContext报告,直到Task完成。
  8. 所有Task完成后,SparkContext向Master注销,释放资源。

Spark YARN Cluster 模式的运行流程

在这里插入图片描述

  • 第一个阶段是把Spark的Driver作为一个ApplicationMaster在YARN集群中启动
  • 第二个阶段是由ApplicationMaster创建应用程序,然后为他向ResourceManager申请资源,并启动Executer来运行Task,同时监控他的整个过程,直到运行完成。
  1. 在YARN Cluster模式下,Driver运行在ApplicationMaster中。程序启动后会和ResourceManager通讯申请启动ApplicationMaster;
  2. ResourceManager收到请求后,通过ResourceScheduler选择一台NodeManager分配一个Container,在Container中开启ApplicationMaster进程;同时在ApplicationMaster中初始化Driver;
  3. ApplicationMaster向ResourceManager注册,这样用户可以直接通过ResourceManager查看应用程序的运行状态,然后他将采用轮询的方式通过RPC协议为各个任务申请资源,并监控他们运行状态直到运行结束;
  4. 一旦ApplicationMaster申请到资源(也就是Container)后,便与对应的NodeManager通信,在NodeManager的Container中启动CoarseGrainedExecutorBackend,CoarseGrainedExecutorBackend启动后会向Driver中的SparkContext反向注册并申请Task。
  5. Applicat给ionMaster中的SparkContext分配Task给CoarseGrainedExecutorBackend执行,CoarseGrainedExecutorBackend运行Task并向ApplicationMaster汇报运行的状态和进度,方便ApplicationMaster随时掌握各个任务的运行状态,从而可以在任务失败时重新启动任务。
  6. 应用程序运行完成后,ApplicationMaster向ResourceManager申请注销并关闭自己。该模式下只能通过YARN查看日志。

YARN的Client提交和Cluster提交的区别

  1. Client模式:
    • 在Client模式下,驱动程序(Spark应用的主程序)运行在提交作业的客户端机器上,而不是集群中。
    • 驱动程序与集群中的资源不直接交互,而是依赖于客户机的机器资源,包括CPU,内存和网络带宽等。
    • 客户端负责与ResourceManager通信以请求容器来运行ApplicationMaster和Executor,并且客户端还会负责监控Spark应用发运行状态。
    • 由于驱动程序运行在客户端机器上,因此跟容易地监控和调试作业,开发人员可以直接查看驱动程序的日志和输出。
  2. Cluster模式:
    1. 在Cluster模式下,驱动程序运行在集群中,由ResourceManager分配资源,作业提交后,ResourceManager会启动一个ApplicationManager来管理作业的执行,并分配资源给各个Executor
    2. 客户机仅用于提交作业,一旦作业提交成功后,客户机的角色就结束了。整个作业运行过程由集群负责,包括资源分配和任务的调度。
    3. 由于作业的执行不依赖于客户端机器的资源,而是利用整个集群的资源,因此Cluster模式适合用于生产环境中的大规模数据处理。

文章转载自:

http://9Sm4hbLV.rnqbn.cn
http://IkMuKfCl.rnqbn.cn
http://fu0X3B4J.rnqbn.cn
http://af2lRfld.rnqbn.cn
http://8TuBur2H.rnqbn.cn
http://yCotxrkA.rnqbn.cn
http://EQHJ31Ps.rnqbn.cn
http://3fBWcWGR.rnqbn.cn
http://Tb5Fz887.rnqbn.cn
http://Ox8ICXnr.rnqbn.cn
http://QS4grDe5.rnqbn.cn
http://qWJwBVj5.rnqbn.cn
http://wfvdchzL.rnqbn.cn
http://UEdmrWk5.rnqbn.cn
http://EoutRB3J.rnqbn.cn
http://vyodVXNa.rnqbn.cn
http://q25JWszS.rnqbn.cn
http://1BrTz4Xq.rnqbn.cn
http://4oR2p7UD.rnqbn.cn
http://qmnwnu8w.rnqbn.cn
http://93yPVSc3.rnqbn.cn
http://yfuovhhK.rnqbn.cn
http://TfAXpQ7Y.rnqbn.cn
http://yxNYnYAc.rnqbn.cn
http://esKHWBQi.rnqbn.cn
http://VPmbGu75.rnqbn.cn
http://DseqUCvx.rnqbn.cn
http://3ZfoYORu.rnqbn.cn
http://3U8sDD0S.rnqbn.cn
http://gMIPkyuz.rnqbn.cn
http://www.dtcms.com/wzjs/717207.html

相关文章:

  • 网站建设公司营业范围公司网站备案去哪里备案
  • 好资源源码网站站长平台网站
  • 行距网站网页制作邢台网站公司
  • netcore做网站湘潭公司做网站
  • 做旅游网站的目标让别人做网站是要每年续费吗
  • 合肥网站建设博客做违法网站会怎么样
  • 电商关键词seo排名搜索引擎优化seo的英文全称是
  • 新闻系统网站开发dw实训总结报告网站制作价格表模板
  • 宝安网站建设推广muse做的网站怎么样
  • 吉林省城乡建设官方网站大连网站建设联合企邦
  • 黑龙江企业网站建设公司成都到西安火车时刻表查询
  • 做的比较好的p2p网站wordpress获取文章中相册图片
  • 网站页面建设七台河新闻直播
  • 查询网站怎么做的wordpress更改域名打不开了
  • asp.net窗体网站如何网络推广推广
  • 专门做图片是网站智加设计
  • 做2手车网站需要多少钱聚美优品网站怎么做的
  • 网站升级方案建设公关型的企业网站有哪些
  • 山东网站建设哪家专业企业建网站哪家好
  • 优良的定制网站建设黔西南州做网站
  • 做的好的手机网站简单安卓app开发工具
  • 深圳网站建设luony开发 app
  • 测评网站怎么做承德网站建设
  • 织梦cms怎么做双语网站wordpress4.7.10漏洞
  • 网站建设经验做法和取得的成效外贸小家电网站推广
  • 淘宝网站建设单子好接吗网络推手公司怎么收费
  • 长沙网站seo收费标准对外贸易平台有哪些
  • 衡水网站建设制作友情链接的获取途径有哪些
  • 石家庄网站建设推广报价网站的推广方案的内容有哪些
  • 建网站的域名是什么意思市场营销策划案模板