当前位置: 首页 > news >正文

Spark应用部署模式实例

Local模式

新启动一个终端

SparkSubmit # pyspark命令启动的进程,实际上就是启动了一个Spark应用程序

Spark Standalone模式

讲解:

6321 SecondaryNameNode  

 #hadoop中HDFS第二数据存储节点,负责定期合并 fsimage 和 edits log 文件  

 7475 Jps  

 6132 DataNode  

 #hadoop中HDFS的数据存储节点,负责存储实际的数据块,并响应来自客户端或 NameNode 的读写请求。  

 7332 Worker  

#spark工作节点,负责接收 Master 节点分配的任务并在本地执行这些任务  

5973 NameNode  

 #hadoop中HDFS的名称节点(核心组件),管理文件系统的命名空间,并控制客户端对文件的访问。  

 6456 ResourceManager  

 #hadoop中YARN的资源经理(主控服务),负责集群资源管理和调度应用的任务。  

 7416 HistoryServer  

 #历史服务进程  

 6761 NodeManager  

 #hadoop中YARN的工作节点上的代理,负责容器生命周期管理,并监控资源使用情况(如CPU、内存、磁盘、网络等)。  

7180 Master  

 #spark主节点,负责集群管理和资源分配  

Spark on YARN模式

停止Standalone服务,启动YARN服务:

将Spark安装目录中的jars依赖库文件放到HDFS上

修改spark-env.sh配置文件

以YARN集群模式启动PySparkShell交互式编程环境

示例应用程序pi.py提交到YARN集群中运行

先关闭Local模式

在浏览器输入:http://localhost:8088/ 查看

http://www.dtcms.com/a/176280.html

相关文章:

  • 力扣刷题Day 37:LRU 缓存(146)
  • 双线性配对
  • 从创意到变现:独立创造者的破局之路——解码《Make:独立创造者手册》
  • NetBox Docker 全功能部署方案(Ubuntu 22.04 + Docker)
  • 发行基础:Epic平台上传流程
  • ESP32蓝牙开发笔记(十四)
  • 民宿管理系统6
  • 第3章 模拟法
  • 遥感数据处理、机器学习建模与空间预测的全流程指南——涵盖R语言(随机森林、XGBoost、SVM等)、特征提取、模型优化及生态学案例分析
  • 3、食品包装控制系统 - /自动化与控制组件/food-packaging-control
  • 162558-52-3,MCLA的化学发光是一种的超氧化物检测手段
  • Hadoop客户端环境准备
  • 【大模型面试每日一题】Day 11:参数高效微调方法(如LoRA、Adapter)的核心思想是什么?相比全参数微调有何优缺点?
  • OpenCV 中用于背景分割的一个类cv::bgsegm::BackgroundSubtractorGMG
  • FFmpeg(7.1版本)编译生成ffplay
  • Linux 系统命令使用指南1
  • 项目文档归档的最佳实践有哪些?
  • 数字电子技术基础(五十五)——D触发器
  • 微信小程序预览文件 兼容性苹果
  • 【C++】类和对象(下)
  • 桥接模式(Bridge)
  • ubuntu nobel + qt5.15.2 设置qss语法识别正确
  • 应用 | AI 自动化某讯会议转录与摘要生成系统
  • 使用英伟达 Riva 和 OpenAI 构建 AI 聊天机器人
  • 游戏引擎学习第263天:添加调试帧滑块
  • 数据报(Datagram)与虚电路(Virtual Circuit)的区别
  • 无线局域网专题 | 第十一章 | AC+AP配置
  • 【Java学习笔记】封装
  • C# 语言介绍
  • 实变函数 第四章 可测函数