当前位置: 首页 > wzjs >正文

编织网站建设润才网站建设

编织网站建设,润才网站建设,做类似起点的网站,嘉兴市南湖区建设局网站1. Spark 的运行模式 部署Spark集群就两种方式,单机模式与集群模式 单机模式就是为了方便开发者调试框架的运行环境。但是生产环境中,一般都是集群部署。 现在Spark目前支持的部署模式: (1)Local模式:在本地…

1. Spark 的运行模式

        部署Spark集群就两种方式,单机模式与集群模式

        单机模式就是为了方便开发者调试框架的运行环境。但是生产环境中,一般都是集群部署。

        现在Spark目前支持的部署模式:

        (1)Local模式:在本地部署单个Spark服务

        (2)Standalone模式:Spark自带的任务调度模式

        (3)Yarn模式:Spark使用Hadoop的YARN组件进行资源与任务调度。        

        (4)Mesos模式:Spark使用Mesos平台进行资源与任务的调度。

        如果资源是当前节点提供的就是单机模式,

        如果资源是当前多个节点提供的就是集群模式/分布式模式,

                如果资源是Yarn管理的就是Yarn部署环境(这个用的多)

                如果资源是由Spark自己管理的就是Spark部署环境

2.Spark 的安装

下载地址:

        1)官网地址:http://spark.apache.org/

        2)文档查看地址:Redirecting…

        3)下载地址:https://spark.apache.org/downloads.html

https://archive.apache.org/dist/spark/

2.1 Local 模式

1) 上传本地Spark的安装包并解压

tar -zxvf spark-3.3.1-bin-hadoop3.tgz -C /opt/module/

         这时候我们就把我们的环境安装好了

        这时候我们要去运行一个案例试一下,看看能不能跑起来

 bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master local[2] \
./examples/jars/spark-examples_2.12-3.3.1.jar \
10

解释

--class 表示要执行的主类

--master local[2]

        1)local:没有指定线程数,则就是单线程执行

        2)local [K]:指定使用K个core来运行计算,比如local[2]就是运行两个2个Core来执行。      

        3) local[*]: 帮你按照当前最多核心数去运行。 

          以上过程可以简化为,运行业务代码,启动进程,申请资源,执行计算,终止进程,资源释放。

        我们如何看到这个运行的过程呢?

        我们可以在Spark运行的时候,另一个行命令行窗口输入jps查看正在运行的进程。

        如果我们还想看一些比较详细的信息,可以在【主机名:4040】中查看正在运行的任务,想用这个查看提交的任务,必须保证有spark正在运行。

2.2 Yarn模式        

        yarn模式就是由本地启动一个进程去提交一个任务给Yarn,然后Yarn分配给资源去运行 

   部署Yarn模式的步骤

1. 解压Spark  

 tar -zxvf spark-3.3.1-bin-hadoop3.tgz -C /opt/module/

2. 进入到/opt/module, 修改目录名 spark-3.3.1-bin-hadoop3 为spark-yarn

3. 修改hadoop配置文件/opt/module/hadoop/etc/hadoop/yarn-site.xml,添加如下内容

vim yarn-site.xml

<!--是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认是true -->

<property>

     <name>yarn.nodemanager.pmem-check-enabled</name>

     <value>false</value>

</property>

<!--是否启动一个线程检查每个任务正使用的虚拟内存量,如果任务超出分配值,则直接将其杀掉,默认是true -->

<property>

     <name>yarn.nodemanager.vmem-check-enabled</name>

     <value>false</value>

</property>

4. 分发配置文件

xsync /opt/module/hadoop/etc/hadoop/yarn-site.xml

 5. 修改/opt/module/spark-yarn/conf/spark-env.sh,添加了YARN_CONF_DIR配置,保证就是能找到yarn位置

mv spark-env.sh.template spark-env.sh
vim spark-env.sh

YARN_CONF_DIR=/opt/module/hadoop/etc/hadoop (需要改成自己对应的配置地址)

 6. 启动HDFS集群和YARN集群

sbin/start-dfs.sh
sbin/start-yarn.sh

7. 然后执行一下上面的那个案例

        看看与local模式有什么不同

        能看到和上图中的driver对应起来了

        ExecutorLauncher--》driver

        YarnCoarseGrainedExecutorBackend--》executor

2.3 配置历史服务配置

1)修改spark-default.conf.template名称

mv spark-defaults.conf.template spark-defaults.conf

2)修改spark-default.conf文件,配置日志存储路径

vim spark-defaults.conf

spark.eventLog.enabled          true

spark.eventLog.dir               hdfs://hadoop102:8020/directory

        然后去hadoop102:9870里创建一个新的文件directory

3)修改spark-env.sh文件,添加如下配置:

vim spark-env.sh

export SPARK_HISTORY_OPTS="

-Dspark.history.ui.port=18080 

-Dspark.history.fs.logDirectory=hdfs://hadoop102:8020/directory

-Dspark.history.retainedApplications=30"

# 参数1含义:WEBUI访问的端口号为18080

# 参数2含义:指定历史服务器日志存储路径(读)

# 参数3含义:指定保存Application历史记录的个数,如果超过这个值,旧的应用程序信息将被删除,这个是内存中的应用数,而不是页面上显示的应用数。

配置查看历史日志

        为了能从Yarn上关联到Spark历史服务器,需要配置spark历史服务器关联路径。

1)修改配置文件/opt/module/spark-yarn/conf/spark-defaults.conf

        添加如下内容:

spark.yarn.historyServer.address=hadoop102:18080

spark.history.ui.port=18080

2)重启Spark历史服务

sbin/stop-history-server.sh 
sbin/start-history-server.sh 

3)提交任务到Yarn执行

bin/spark-submit \

--class org.apache.spark.examples.SparkPi \

--master yarn \

./examples/jars/spark-examples_2.12-3.3.1.jar \

10

4)Web页面查看日志:http://hadoop103:8088/cluster

        然后点击页面的history就能跳转到http:hadoop102:18080/


文章转载自:

http://1XorSDfX.qdxwf.cn
http://fUibawQI.qdxwf.cn
http://mknuEMu1.qdxwf.cn
http://AJhYBQRE.qdxwf.cn
http://KhMYr8BS.qdxwf.cn
http://ydxzPmLW.qdxwf.cn
http://MhIYyAUB.qdxwf.cn
http://SFPE4jWi.qdxwf.cn
http://XdmGxy9y.qdxwf.cn
http://HcPNZOsn.qdxwf.cn
http://P27qyUWe.qdxwf.cn
http://nOB3MxgI.qdxwf.cn
http://GCv63gCw.qdxwf.cn
http://0gUqKwcb.qdxwf.cn
http://i8CylymH.qdxwf.cn
http://NHXPrMwT.qdxwf.cn
http://CCZTh7NB.qdxwf.cn
http://8tlRvdWV.qdxwf.cn
http://00ZnJfnP.qdxwf.cn
http://hwG1lGKi.qdxwf.cn
http://rgFIlIoc.qdxwf.cn
http://XnvbanWu.qdxwf.cn
http://h7xKvM8Y.qdxwf.cn
http://ZxbGKW6D.qdxwf.cn
http://zZ2LEdjL.qdxwf.cn
http://aIqkVZyL.qdxwf.cn
http://ibaS1Nt5.qdxwf.cn
http://TfUD1d7a.qdxwf.cn
http://KrObptEM.qdxwf.cn
http://i5GO2JtF.qdxwf.cn
http://www.dtcms.com/wzjs/631582.html

相关文章:

  • 邯郸网站建设好的公司国家信息公示网
  • 怎么做淘宝客优惠券网站做一个什么网站好
  • 陕西专业做网站广州网络公关公司
  • 网站建设冒用身份信息定西企业网站制作
  • 2018做网站用什么开发赛事网站开发
  • pr值高的网站网站开发模块的需求
  • 中国空间站扩建做设计及免费素材网站有哪些
  • 汽车用品网站源码wordpress手机端网站模板
  • 高端手表资质类网站如何做优化
  • 个人网站建设方案书实例手机网址大全哪个好
  • 我想注册网站我怎么做从零开始建网站
  • 网站开发团队 分工网站备案换公司吗
  • 金山专业网站建设钓鱼网站建设
  • 网站开发 书用户体验设计流程
  • 用网站ip做代理可信网站图标 费流量
  • 企业网站策划案怎么写新品怎么刷关键词
  • 花木网站模版营销管理咨询
  • 国外大型购物网站动漫与游戏制作专业有前途吗
  • 两学一做网站视频北京漫步云端网站建设
  • 做宾馆网站网站目录优化
  • 网站开发与制作网上接工程活做的网站
  • 织梦 调用网站地址网站内容和备案不一
  • 有关大数据的网站及网址谷歌优化师是做什么的
  • 长沙企业建站系统网络运维服务平台
  • 网站定制开发费用多少php网站开发手机绑定
  • 网站开发了解客户需求希尔顿酒店网站建设的优点
  • 网站建设中合作加盟的作用如何充实网站内容
  • 大连 网站建设全国被执行人名单查询
  • 成都装修公司一览表河北百度seo关键词排名
  • 做网站电子版报价模板精简wordpress头部信息