当前位置: 首页 > news >正文

Spark应用部署模式实例

Local模式

新启动一个终端

SparkSubmit # pyspark命令启动的进程,实际上就是启动了一个Spark应用程序

Spark Standalone模式

讲解:

6321 SecondaryNameNode  

 #hadoop中HDFS第二数据存储节点,负责定期合并 fsimage 和 edits log 文件  

 7475 Jps  

 6132 DataNode  

 #hadoop中HDFS的数据存储节点,负责存储实际的数据块,并响应来自客户端或 NameNode 的读写请求。  

 7332 Worker  

#spark工作节点,负责接收 Master 节点分配的任务并在本地执行这些任务  

5973 NameNode  

 #hadoop中HDFS的名称节点(核心组件),管理文件系统的命名空间,并控制客户端对文件的访问。  

 6456 ResourceManager  

 #hadoop中YARN的资源经理(主控服务),负责集群资源管理和调度应用的任务。  

 7416 HistoryServer  

 #历史服务进程  

 6761 NodeManager  

 #hadoop中YARN的工作节点上的代理,负责容器生命周期管理,并监控资源使用情况(如CPU、内存、磁盘、网络等)。  

7180 Master  

 #spark主节点,负责集群管理和资源分配  

Spark on YARN模式

停止Standalone服务,启动YARN服务:

将Spark安装目录中的jars依赖库文件放到HDFS上

修改spark-env.sh配置文件

以YARN集群模式启动PySparkShell交互式编程环境

示例应用程序pi.py提交到YARN集群中运行

先关闭Local模式

在浏览器输入:http://localhost:8088/ 查看

相关文章:

  • 力扣刷题Day 37:LRU 缓存(146)
  • 双线性配对
  • 从创意到变现:独立创造者的破局之路——解码《Make:独立创造者手册》
  • NetBox Docker 全功能部署方案(Ubuntu 22.04 + Docker)
  • 发行基础:Epic平台上传流程
  • ESP32蓝牙开发笔记(十四)
  • 民宿管理系统6
  • 第3章 模拟法
  • 遥感数据处理、机器学习建模与空间预测的全流程指南——涵盖R语言(随机森林、XGBoost、SVM等)、特征提取、模型优化及生态学案例分析
  • 3、食品包装控制系统 - /自动化与控制组件/food-packaging-control
  • 162558-52-3,MCLA的化学发光是一种的超氧化物检测手段
  • Hadoop客户端环境准备
  • 【大模型面试每日一题】Day 11:参数高效微调方法(如LoRA、Adapter)的核心思想是什么?相比全参数微调有何优缺点?
  • OpenCV 中用于背景分割的一个类cv::bgsegm::BackgroundSubtractorGMG
  • FFmpeg(7.1版本)编译生成ffplay
  • Linux 系统命令使用指南1
  • 项目文档归档的最佳实践有哪些?
  • 数字电子技术基础(五十五)——D触发器
  • 微信小程序预览文件 兼容性苹果
  • 【C++】类和对象(下)
  • 习近平会见古巴国家主席迪亚斯-卡内尔
  • AI药企英矽智能第三次递表港交所:去年亏损超1700万美元,收入多数来自对外授权
  • 胳膊一抬就疼,炒菜都成问题?警惕这种“炎症”找上门
  • 陕西澄城樱桃在上海推介,向长三角消费者发出“甜蜜之邀”
  • 金融监管总局:近五年民企贷款投放年平均增速比各项贷款平均增速高出1.1个百分点
  • 陕西澄城打造“中国樱桃第一县”:从黄土高原走向海外,年产值超30亿