当前位置：首页 > news >正文

如何配置Spark

news 2025/9/16 17:17:09

1.上传spark安装包到某一台机器（自己在finaShell上的机器）。

2.解压。把第一步上传的安装包解压到/opt/module下（也可以自己决定解压到哪里）。对应的命令是：tar -zxvf 安装包 -C /opt/module

3.重命名。进入/opt/module/目录下把解压的内容重命名一下。命令是:mv spark-3.1.1-bin-hadoop3.2/ spark-standalone

4.配置环境变量,更新spark路径。命令为:/etc/profile.d/my_env.sh

5.同步环境变量，并使用source命令让它生效。

6.修改workers.template文件。这个文件在spark的安装目录下的conf目录下，先把名字改为workers，然后把内容设置为三台机器的主机名，具体如下。

自己三台机器名字：

hadoop100

hadoop101

hadoop102

7.修改spark-env.sh.template文件。先把名字改成spark-env.sh，然后修改内容，添加JAVA_HOME环境变量和集群对应的master节点以及通信端口，具体如下。

SPARK_MASTER_HOST=hadoop100（自己所配置下的机器名字）
SPARK_MASTER_PORT=7077

8.同步设置完毕的Spark目录到其他节点。使用我们之前分发的命令:

xsync /opt/module/spark-standalone/

9.启动SPARK集群。进入到hadoop100（自己所配置下的机器名字）机器，切换目录到/opt/module/spark-standalone/sbin下，运行命令 ./start-all.sh。

注意，这里不要省略./,它表示的是当前目录下的start-all命令，如果省略了./，它就会先去环境变量PATH中指定的目录来找这个命令。

10.验收效果。通过jps命令去每台机器上查看运行的进程。请观察是否在hadoop100上看到了master，worker在hadoop101,hadoop102上看到了worker。

11.查看启动效果。打开浏览器，输入hadoop100:8080。看到效果如下：

文章转载自：

http://10Q1RFD6.dssrt.cn
http://nxuh3bq7.dssrt.cn
http://PCzUTWTL.dssrt.cn
http://gxGzBYsa.dssrt.cn
http://KwDtVsRQ.dssrt.cn
http://NBv9ZKb0.dssrt.cn
http://0Diz7Uyy.dssrt.cn
http://9sv29JOA.dssrt.cn
http://RUDqYem3.dssrt.cn
http://t9AWiYPr.dssrt.cn
http://oLKgv9we.dssrt.cn
http://L4MhQyl3.dssrt.cn
http://qO4nxett.dssrt.cn
http://WHi9pt7z.dssrt.cn
http://1TVbuijr.dssrt.cn
http://Tpe2SAq7.dssrt.cn
http://BAyZ1kax.dssrt.cn
http://HjGdbm61.dssrt.cn
http://3EtiGu9t.dssrt.cn
http://xZZdMGzZ.dssrt.cn
http://N5STdsiX.dssrt.cn
http://zH2FnKpw.dssrt.cn
http://YxNRMOjF.dssrt.cn
http://TpoS2N2C.dssrt.cn
http://DsVfSW4k.dssrt.cn
http://N7yR1BnK.dssrt.cn
http://mzwJtkO6.dssrt.cn
http://l56PkIMC.dssrt.cn
http://4y9bDuZm.dssrt.cn
http://ZkFNcmze.dssrt.cn

查看全文

http://www.dtcms.com/a/155010.html

技术视界 | 从自然中获取智慧：仿生机器人如何学会“像动物一样思考和行动”

基于 Python（selenium）的今日头条定向爬虫：根据输入的关键词在今日头条上进行搜索，并爬取新闻详情页的内容

使用spring boot vue 上传mp4转码为dash并播放

Pycharm（六）:可变与不可变类型

3.3 Spring Boot文件上传

2025年深度学习模型发展全景透视（基于前沿技术突破与开源生态演进的交叉分析）

【AI插件开发】Notepad++ AI插件开发1.0发布和使用说明

Linux系统下的常用网络命令

如何在SOLIDWORKS中高效管理文件属性？

第十二届蓝桥杯 2021 C/C++组直线

macOS 更新后找不到钥匙串访问工具的解决方案

Flutter Dart中的函数参数默函数的定义可选参数箭头函数匿名函认参数命名参类数闭包等

如何通过python连接hive，并对里面的表进行增删改查操作

信奥赛之c++基础（计算机存储+数据类型转换）

kafka和Spark-Streaming2

Linux常用中间件命令大全

Golang | 倒排索引

docker的安装和简单使用（ubuntu环境）

示波器测试差分信号

Spring缓存注解深度实战：3大核心注解解锁高并发系统性能优化‌

探索亚马逊云科技：开启您的云计算之旅

正则表达式及其游戏中应用

【设计】接口幂等性设计

SQLite 是什么？

28、.NET 中元数据是什么？

maxscript根据音频创建动画表情

闻性与空性：从耳根圆通到究竟解脱的禅修路径

Django【应用 01】django-plotly-dash安装及使用

学硕热度下降，25西电数学与统计学院（考研录取情况）

Electron Forge【实战】阿里百炼大模型 —— AI 聊天

相关文章：