当前位置: 首页 > news >正文

Spark,从0开始配置Spark的local模式

从0开始配置Spark的local模式

具体步骤:

1.启动虚拟机(开一台即可)

2.通过finalshell连接虚拟机,并将文件上传安装文件到 /opt/software下

3.解压spark安装文件到/opt/module下
tar -zxvf spark-3.3.1-bin-hadoop3.tgz -C /opt/module/

4.重命名,把解压后的文件夹改成spark-local。因为后续我们还会使用其他的配置方式,所以这里先重命名一次。mv是linux的命令,

 mv spark-3.3.1-bin-hadoop3 spark-local

5.配置环境变量

     ① 打开etc/profile.d/my_env.sh文件中,补充设置spark的环境变量。

export SPARK_HOME=/opt/module/spark-local
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

     ② 使用 source 命令让环境变量生效

        [root@hadoop100 module]# cd /etc/profile.d
        [root@hadoop100 profile.d]# source my_env.sh

     运行一下下面两行代码

        [root@hadoop100 profile.d]# cd /opt/module
        [root@hadoop100 module]# spark-submit --version

     出现下列就是对的,成功了

现在我们使用单机模式运行第一个Spark程序

示例:

进入到spark-local,运行命令spark-submit命令。

spark-submit --class org.apache.spark.examples.SparkPi --master local[2] /opt/module/spark-local/examples/jars/spark-examples_2.12-3.1.1.jar 10

结果展示:

查看运行任务详情

在任务还处于运行状态时,可以通过hadoop100:4040来查看。

注:一旦任务结束,则这个界面就不可访问了。

相关文章:

  • 实时进程简单说明
  • IDEA内存配置失效(已解决)
  • 龙虎榜——20250421
  • 流程执行松散,如何强化规范?
  • QT写的exe嵌入到wpf中
  • 4月22日直播预告|AI赋能开发提效,三大应用场景实战分享
  • 安恒安全渗透面试题
  • electron从安装到启动再到打包全教程
  • Eteam 0.3版本开发规划
  • 【Easylive】使用Seata解决分布式事务问题
  • 华为云获取IAM用户Token的方式及适用分析
  • 阿里云入门手册
  • 富文本编辑器
  • SSH反向代理
  • go语言的八股文
  • 突破传统!SEARCH-R1如何让LLM与搜索引擎协同推理?
  • 音视频学习(三十五):aud
  • DeepSeek 大模型 + LlamaIndex + MySQL 数据库 + 知识文档 实现简单 RAG 系统
  • from tensorflow.keras.models import Model中Model报红;以及动态链接库(DLL)初始化例程失败
  • TensorFlow和PyTorch学习原理解析
  • 49:49白热化,美参议院对新关税政策产生巨大分歧
  • 经济日报社论:书写新征程上奋斗华章
  • 美国务院宣布新一轮与伊朗相关的制裁
  • 移动互联网未成年人模式正式发布
  • 中吉乌铁路重点控制性工程开工建设,包括三座隧道
  • 北京朝阳涉住宅组团地块126亿元成交