当前位置：首页 > news >正文

Spark应用部署模式实例

news 2025/11/4 11:56:07

Local模式

新启动一个终端

SparkSubmit # pyspark命令启动的进程，实际上就是启动了一个Spark应用程序

Spark Standalone模式

讲解：

6321 SecondaryNameNode

#hadoop中HDFS第二数据存储节点，负责定期合并 fsimage 和 edits log 文件

7475 Jps

6132 DataNode

#hadoop中HDFS的数据存储节点，负责存储实际的数据块，并响应来自客户端或 NameNode 的读写请求。

7332 Worker

#spark工作节点，负责接收 Master 节点分配的任务并在本地执行这些任务

5973 NameNode

#hadoop中HDFS的名称节点（核心组件），管理文件系统的命名空间，并控制客户端对文件的访问。

6456 ResourceManager

#hadoop中YARN的资源经理（主控服务），负责集群资源管理和调度应用的任务。

7416 HistoryServer

#历史服务进程

6761 NodeManager

#hadoop中YARN的工作节点上的代理，负责容器生命周期管理，并监控资源使用情况（如CPU、内存、磁盘、网络等）。

7180 Master

#spark主节点，负责集群管理和资源分配

Spark on YARN模式

停止Standalone服务，启动YARN服务：

将Spark安装目录中的jars依赖库文件放到HDFS上

修改spark-env.sh配置文件

以YARN集群模式启动PySparkShell交互式编程环境

示例应用程序pi.py提交到YARN集群中运行

先关闭Local模式

在浏览器输入：http://localhost:8088/ 查看

查看全文

http://www.dtcms.com/a/176280.html

力扣刷题Day 37：LRU 缓存（146）

双线性配对

从创意到变现：独立创造者的破局之路——解码《Make：独立创造者手册》

NetBox Docker 全功能部署方案（Ubuntu 22.04 + Docker）

发行基础：Epic平台上传流程

ESP32蓝牙开发笔记（十四）

民宿管理系统6

第3章模拟法

遥感数据处理、机器学习建模与空间预测的全流程指南——涵盖R语言（随机森林、XGBoost、SVM等）、特征提取、模型优化及生态学案例分析

3、食品包装控制系统 - /自动化与控制组件/food-packaging-control

162558-52-3，MCLA的化学发光是一种的超氧化物检测手段

Hadoop客户端环境准备

【大模型面试每日一题】Day 11：参数高效微调方法（如LoRA、Adapter）的核心思想是什么？相比全参数微调有何优缺点？

OpenCV 中用于背景分割的一个类cv::bgsegm::BackgroundSubtractorGMG

FFmpeg(7.1版本)编译生成ffplay

Linux 系统命令使用指南1

项目文档归档的最佳实践有哪些？

数字电子技术基础（五十五）——D触发器

微信小程序预览文件兼容性苹果

【C++】类和对象（下）

桥接模式(Bridge)

ubuntu nobel + qt5.15.2 设置qss语法识别正确

应用 | AI 自动化某讯会议转录与摘要生成系统

使用英伟达 Riva 和 OpenAI 构建 AI 聊天机器人

游戏引擎学习第263天:添加调试帧滑块

数据报（Datagram）与虚电路（Virtual Circuit）的区别

无线局域网专题 | 第十一章 | AC+AP配置

【Java学习笔记】封装

C# 语言介绍

实变函数第四章可测函数

Local模式

Spark Standalone模式

Spark on YARN模式

相关文章：