当前位置: 首页 > news >正文

Spark on K8s 在 vivo 大数据平台的混部实战与优化

一、Spark on K8s 简介

(一)定义与架构

Spark on K8s 是一种将 Spark 运行在 Kubernetes(K8s)集群上的架构,由 K8s 直接创建 Driver 和 Executor 的 Pod 来运行 Spark 作业。其架构如下。

  • Driver Pod:相当于 Spark 集群中的 Driver,负责作业的调度和管理,它会根据作业的逻辑,将任务分配给 Executor Pod。

  • Executor Pod:相当于 Spark 集群中的 Executor,负责具体的任务执行,包括数据的读取、计算和写入等操作。

  • K8s API Server:负责接收和处理 Spark 提交的作业请求,创建和管理 Driver Pod 和 Executor Pod。

  • K8s Scheduler:根据集群的资源状况,为 Driver Pod 和 Executor Pod 分配合适的节点进行运行。

  • K8s Node:集群中的工作节点,负责运行 Driver Pod 和 Executor Pod。



相关文章:

  • 处理图像的深度神经网络(DNN)有哪些呢?
  • MCP服务端开发
  • Thymeleaf简介
  • 基于单片机的温湿度采集系统(论文+源码)
  • uniapp打包报错,
  • 第12篇:Linux程序访问控制FPGA端Switch<一>
  • 习题2.8 输出全排列
  • linux ptrace 图文详解(六) gdb单步调试
  • OJ笔试强训_1至24天
  • PHP腾讯云人脸核身获取SIGN Ticket
  • 强化学习算法系列(六):应用最广泛的算法——PPO算法
  • vcpkg缓存问题研究
  • [Redis]1-高效的数据结构P2-Set
  • C++获取程序的所有用到的库
  • Flash存储器(二):SPI NAND Flash与SPI NOR Flash
  • 2025-04-19 Python 强类型编程
  • GEO优化之企业客服知识库搭建全流程实例(医疗健康行业)
  • Kafka系列之:计算kafka集群topic占的存储大小
  • Kafka安全认证技术:SASL/SCRAM-ACL方案详解
  • 【KWDB 创作者计划】_算法篇---Stockwell变换
  • 《大风杀》导演张琪:为了不算计观众,拍了部不讨好的警匪片
  • 从《让·桑特伊》到《追忆》,假故事的胜利
  • 中巡组在行动丨①震慑:这些地区有官员落马
  • 梅花奖在上海丨陈丽俐“婺剧折戏专场”:文戏武做,武戏文唱
  • 线下哪些商家支持无理由退货?查询方法公布
  • 《AI×SCIENCE十大前沿观察》9:合成数据和数据基础设施