当前位置：首页 > wzjs >正文

重庆做网站的cba最新消息

wzjs 2025/8/22 16:15:41

重庆做网站的,cba最新消息,涂料网站设计,个人做外贸接订单网站实验目标： 本节课实验将完成Spark 4种部署模式的其中2种，分别是Local、Standalone模式。实验准备工作： 三台linux虚拟机spark的压缩包实验步骤： Spark-local Spark的Local模式仅需要单个虚拟机节点即可，无需启…

实验目标：

本节课实验将完成Spark 4种部署模式的其中2种，分别是Local、Standalone模式。

实验准备工作：

三台linux虚拟机
spark的压缩包

实验步骤：

Spark-local

Spark的Local模式仅需要单个虚拟机节点即可，无需启动hadoop集群。实验步骤如下：

1. 将spark的安装包上传到虚拟机node01中（建议路径：/opt/software/spark）并解压缩文件。将解压文件夹重命名为spark-local

解压：tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz

重命名：mv spark-3.0.0-bin-hadoop3.2.tgz spark-local

2. 启动Local环境。进入spark-local中，执行如下命令：

bin/spark-shell

启动成功后，可以输入网址进行Web UI监控页面进行访问。（默认端口为4040）

3. 命令行工具

在解压缩文件夹下的 data 目录中，添加 word.txt 文件。

在命令行工具中执行如下代码指令。

sc.textFile("data/word.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect

4. 退出本地模式

Ctrl+C 或者输入scala命令:quit

5. 提交测试应用

在spark-local路径中输入以下指令：

bin/spark-submit \

--class org.apache.spark.examples.SparkPi \

--master local[2] \

./examples/jars/spark-examples_2.12-3.0.0.jar \

指令说明：

1) --class 表示要执行程序的主类，此处可以更换为咱们自己写的应用程序

2) --master local[2] 部署模式，默认为本地模式，数字表示分配的虚拟 CPU 核数量

3) spark-examples_2.12-3.0.0.jar 运行的应用类所在的 jar 包，实际使用时，可以设定为咱们自己打的 jar 包

4) 数字 10 表示程序的入口参数，用于设定当前应用的任务数量

运行结果：

Spark-standalone

Spark的独立部署模式可以类比HDFS的完全分布式安装，在这个模式中只会使用Spark自身节点来运行集群，Spark-standalone体现了经典的master-slave模式。

集群规划：

	node01	node02	node03
Spark	Master Worker	Worker	Worker

实验步骤：

1. 解压缩文件。将解压后的文件夹重命名为spark-standalone。

mv spark-3.0.0-bin-hadoop3.2 spark-standalone

在node02、node03节点上分别创建spark文件夹（路径为/opt/software/spark）

2. 修改配置文件

①进入spark-standalone的 conf 目录，修改 slaves.template文件名为 slaves

mv slaves.template slaves

②修改slaves文件，添加worker节点

vi slaves

③修改 spark-env.sh.template 文件名为 spark-env.sh

mv spark-env.sh.template spark-env.sh

④修改 spark-env.sh 文件，添加Java的环境变量和集群对应的 master 节点

vi spark-env.sh

⑤分发 spark-standalone 目录（需要提前在node02、node03节点的对应路径创建spark文件夹）

scp -r spark-standalone node02:/opt/software/spark

scp -r spark-standalone node03:/opt/software/spark

启动集群

①在spark-standalone路径下执行脚本命令

sbin/start-all.sh

②查看三台节点的运行进程

③查看Master资源监控Web UI界面 node01:8080

④提交测试应用

bin/spark-submit \

--class org.apache.spark.examples.SparkPi \

--master spark://node01:7077 \

./examples/jars/spark-examples_2.12-3.0.0.jar \

参数说明：

1) --class 表示要执行程序的主类

2) --master spark://node01:7077 独立部署模式，连接到 Spark 集群

3) spark-examples_2.12-3.0.0.jar 运行类所在的 jar 包

4) 数字 10 表示程序的入口参数，用于设定当前应用的任务数量

执行任务时，节点会产生多个Java进程

执行任务时，默认采用服务器集群节点的总核数，每个节点内存 1024M。

配置历史服务

由于 spark-shell 停止掉后，集群监控 node01:4040 页面就看不到历史任务的运行情况，所以开发时都配置历史服务器记录任务运行情况。

①修改 spark-defaults.conf.template 文件名为 spark-defaults.conf

mv spark-defaults.conf.template spark-defaults.conf

②修改 spark-default.conf 文件，配置日志存储路径

注意：需要启动 hadoop 集群，HDFS 上的 directory 目录需要提前存在。

hdfs dfs -mkdir /directory

③修改 spark-env.sh 文件, 添加日志配置

export SPARK_HISTORY_OPTS="

-Dspark.history.ui.port=18080

-Dspark.history.fs.logDirectory=hdfs://node01:9000/directory

-Dspark.history.retainedApplications=30"

参数含义：

⚫ 参数 1 含义：WEB UI 访问的端口号为 18080

⚫ 参数 2 含义：指定历史服务器日志存储路径

⚫ 参数 3 含义：指定保存 Application 历史记录的个数，如果超过这个值，旧的应用程序信息将被删除，这个是内存中的应用数，而不是页面上显示的应用数。

④分发配置文件

scp -r spark-defaults.conf node02:$PWD

scp -r spark-defaults.conf node03:$PWD

scp -r spark-env.sh node02:$PWD

scp -r spark-env.sh node03:$PWD

⑤重新启动spark集群并启动历史服务

sbin/stop-all.sh

sbin/start-all.sh

sbin/start-history-server.sh

⑥重新执行任务

bin/spark-submit \

--class org.apache.spark.examples.SparkPi \

--master spark://node01:7077 \

./examples/jars/spark-examples_2.12-3.0.0.jar \

⑦查看历史任务 node01:18080

查看全文

http://www.dtcms.com/wzjs/444144.html

wordpress会员推广系统网站首页排名seo搜索优化

电子商务网站建设总结陕西网络营销优化公司

阿里云网站建设模板怀柔网站整站优化公司

头条滚动 wordpress武汉seo工厂

网站首页被k 做跳转市场营销计划

打开一个网站搜索页面跳转js百度网址大全旧版

苏州做网站公司精选苏州聚尚网络搜索热词排名

自己做报名网站长春网长春关键词排名站设计

深圳网站建设排名合肥百度seo代理

党政门户网站建设工作情况win7系统优化软件

外包工是临时工吗seo服务商

wamp可以做视频网站吗短链接生成

织梦网站版本宁波seo网络优化公司

网站色彩搭配技巧国际新闻界期刊

模板下载免费网站南宁seo计费管理

网站详情一般是什么公司做seo的概念

简洁的一家设计公司网站作品展示网页模板html5+css3全站下载免费网页制作网站

品牌设计公司网站源码佛山网站建设正规公司

朝阳网站建设培训搜索引擎网站推广如何优化

做软件挣钱的网站教育培训机构前十名

大岭山网站仿做被忽悠去做网销了

iis 设置网站不能访问百度站长工具添加不了站点

专业做鞋子网站百度推广助手电脑版

亚马逊跨境电商平台介绍搜索seo优化

长春建站公司创建网站教程

新郑做网站优化seo交流

企业网站百度认证seo在线诊断工具

网站制作技术使用说明百度百度一下你就知道主页

购物网站开发教程视频推介网

那个网站都有做莱的图片可口可乐搜索引擎营销案例

实验目标：

实验准备工作：

实验步骤：

Spark-local

Spark-standalone

配置历史服务

相关文章：