当前位置：首页 > news >正文

Spark，从0开始配置Spark的local模式

news 2025/10/30 5:36:52

从0开始配置Spark的local模式

具体步骤：

1.启动虚拟机（开一台即可）

2.通过finalshell连接虚拟机，并将文件上传安装文件到 /opt/software下

3.解压spark安装文件到/opt/module下
tar -zxvf spark-3.3.1-bin-hadoop3.tgz -C /opt/module/

4.重命名，把解压后的文件夹改成spark-local。因为后续我们还会使用其他的配置方式，所以这里先重命名一次。mv是linux的命令，

mv spark-3.3.1-bin-hadoop3 spark-local

5.配置环境变量

① 打开etc/profile.d/my_env.sh文件中，补充设置spark的环境变量。

export SPARK_HOME=/opt/module/spark-local
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

② 使用 source 命令让环境变量生效

[root@hadoop100 module]# cd /etc/profile.d
[root@hadoop100 profile.d]# source my_env.sh

运行一下下面两行代码

[root@hadoop100 profile.d]# cd /opt/module
[root@hadoop100 module]# spark-submit --version

出现下列就是对的，成功了

现在我们使用单机模式运行第一个Spark程序

示例：

进入到spark-local，运行命令spark-submit命令。

spark-submit --class org.apache.spark.examples.SparkPi --master local[2] /opt/module/spark-local/examples/jars/spark-examples_2.12-3.1.1.jar 10

结果展示：

查看运行任务详情

在任务还处于运行状态时，可以通过hadoop100:4040来查看。

注：一旦任务结束，则这个界面就不可访问了。

查看全文

http://www.dtcms.com/a/146274.html

实时进程简单说明

IDEA内存配置失效（已解决）

龙虎榜——20250421

流程执行松散，如何强化规范？

QT写的exe嵌入到wpf中

4月22日直播预告｜AI赋能开发提效，三大应用场景实战分享

安恒安全渗透面试题

electron从安装到启动再到打包全教程

Eteam 0.3版本开发规划

【Easylive】使用Seata解决分布式事务问题

华为云获取IAM用户Token的方式及适用分析

阿里云入门手册

富文本编辑器

SSH反向代理

go语言的八股文

突破传统！SEARCH-R1如何让LLM与搜索引擎协同推理？

音视频学习（三十五）：aud

DeepSeek 大模型 + LlamaIndex + MySQL 数据库 + 知识文档实现简单 RAG 系统

from tensorflow.keras.models import Model中Model报红；以及动态链接库(DLL)初始化例程失败

TensorFlow和PyTorch学习原理解析

创新项目实训开发日志3

维度建模工具箱提纲与总结

Spring如何通过XML注册Bean

Ldap高效数据同步- Delta-Syncrepl复制模式配置实战手册（上）

第 4 篇：平稳性 - 时间序列分析的基石

Github 热点项目 Jumpserver开源堡垒机让服务器管理效率翻倍

前端笔记-Axios

云原生与AI的关系是怎么样的？

Unreal Engine中FRotator与FQuat在赛车游戏方向盘控制中的协同应用解析

Android Kotlin+Compose首个应用

从0开始配置Spark的local模式

现在我们使用单机模式运行第一个Spark程序

相关文章：