当前位置: 首页 > news >正文

【spark3.2.4】--完全分布式集群搭建

一、spark-env.sh 文件配置(操作路径:$SPARK_HOME/conf/spark-env.sh

如果还没创建:

cp $SPARK_HOME/conf/spark-env.sh.template $SPARK_HOME/conf/spark-env.sh

然后编辑(比如用 vim):

vim $SPARK_HOME/conf/spark-env.sh

修改内容如下:

# Java 环境
export JAVA_HOME=/usr/local/src/jdk1.8.0_152# Hadoop 配置目录(用于对接 HDFS)
export HADOOP_CONF_DIR=/usr/local/src/hadoop-3.2.2/etc/hadoop# Spark Master 配置
export SPARK_MASTER_HOST=master01
export SPARK_MASTER_PORT=7077# Spark Worker 资源限制
export SPARK_WORKER_MEMORY=1g
export SPARK_WORKER_CORES=2
export SPARK_WORKER_INSTANCES=1# History Server 配置(写入 event log)
export SPARK_HISTORY_OPTS="-Dspark.history.fs.logDirectory=hdfs://master01:8020/spark-logs -Dspark.history.fs.cleaner.enabled=true -Dspark.history.fs.cleaner.maxAge=7d"

二、workers 文件配置(操作路径:$SPARK_HOME/conf/workers

如果还没创建:

cp $SPARK_HOME/conf/workers.template $SPARK_HOME/conf/workers

编辑文件:

vim $SPARK_HOME/conf/workers

写入每台 Worker 的 hostname(或 IP):

node01
node02

可选写法(如果 DNS 不通):

192.168.1.102
192.168.1.103

三、spark-defaults.conf 文件配置(操作路径:$SPARK_HOME/conf/spark-defaults.conf

如果还没创建:

cp $SPARK_HOME/conf/spark-defaults.conf.template $SPARK_HOME/conf/spark-defaults.conf

编辑文件:

vim $SPARK_HOME/conf/spark-defaults.conf

推荐配置内容如下:

# 集群主节点
spark.master                     spark://master01:7077# 提交模式(client 适合测试,部署集群可用 cluster)
spark.submit.deployMode          client# 启用事件日志
spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://master01:8020/spark-logs# 历史服务器读取的日志目录
spark.history.fs.logDirectory    hdfs://master01:8020/spark-logs# 日志自动清理设置
spark.history.fs.cleaner.enabled true
spark.history.fs.cleaner.maxAge  7d# 默认 executor 资源设置
spark.executor.memory            1g
spark.executor.cores             1# driver 内存设置(本地运行任务时用)
spark.driver.memory              1g

四、HDFS 中创建日志目录

hdfs dfs -mkdir -p /spark-logs
hdfs dfs -chmod -R 755 /spark-logs

如果你用的是非 root 用户运行 Spark,比如 sparkuser

hdfs dfs -chown sparkuser:hadoop /spark-logs

五、启动服务推荐顺序

# 启动 Hadoop 集群
start-dfs.sh# 启动 Spark 集群
start-all.sh# 启动 Spark 历史服务器
start-history-server.sh# 查看 UI 页面(History Server 默认 18080)
http://master01:18080

相关文章:

  • .net core 使用 freesql 备份结构和数据
  • 盈达科技:重新定义GEO优化的技术边界与商业未来​
  • Linux权限机制:用户与组权限深度剖析
  • ngx_epoll_conf_t
  • 前端VUE框架理论与应用(7)
  • 【LangChain实战】构建下一代智能问答系统:从RAG架构到生产级优化
  • Z.ai - 智谱简洁优雅的聊天新界面
  • 学习笔记十三—— 理解 Rust 闭包:从语法到 impl Fn vs Box<dyn Fn>
  • 工作记录3
  • Spark-Sql编程(三)
  • 计算机视觉——基于人工智能视觉注意力的在线广告中评估检测技术
  • 二进制求和 - 简单
  • 数据加载与保存
  • Ubuntu服务器中了木马且处于局域网内无法直接通过公网正向连接
  • Mac OS系统下kernel_task占用大量CPU资源导致系统卡顿
  • Linux:Makefile
  • 数字电子技术基础(四十七)——使用Mutlisim软件来模拟74LS85芯片
  • STM32基础教程——DMA+ADC多通道
  • 【后端】【python】利用反射器----动态设置装饰器
  • 智能语音处理+1.1下载需要的库(100%实现)
  • 网站建设是前端吗/pc网站优化排名软件
  • 做漫画在线观看网站/新闻软文推广案例
  • 西宁微网站建设多少钱/重庆优化seo
  • 佛山怎么做网站/产品网络推广的方法有哪些
  • 广西做网站的公司有哪些/四川刚刚发布的最新新闻
  • 网站建设企业服务商/国内做seo最好公司