当前位置: 首页 > news >正文

Flink SlotSharingGroup 机制详解

1、静态slot分配流程

  1. 客户端提交作业:客户端将JobGraph提交给JobManager,JobGraph包含了作业的逻辑数据流和算子信息。

  2. 生成ExecutionGraph:JobManager将JobGraph转换为ExecutionGraph,这是一个并行化的执行计划,包含了所有执行顶点(ExecutionVertex)和边。

  3. 申请slot资源:JobManager中的调度器向ResourceManager申请slot资源。

  4. 分配静态slot:ResourceManager检查当前可用的TaskManager slot,如果资源足够,就将slot分配给JobManager。

  5. 部署任务:JobManager将任务部署到分配到的slot中执行。

    在这里插入图片描述

2、动态slot分配流程

动态slot分配的核心是为每个SlotSharingGroup单独定义资源需求,Flink会根据这些需求动态申请匹配的slot资源。

  1. 资源需求生成:JobManager分析JobGraph中每个SlotSharing组的资源需求(包括CPU、堆内存、托管内存、扩展资源等)。
  2. 资源声明:Scheduler将SlotRequest进行聚合,生成ResourceRequirement并发送给ResourceManager。
  3. 资源匹配:ResourceManager检查集群中的可用资源,尝试找到匹配的TaskManager slot。
  4. 动态资源申请:如果现有资源不足,ResourceManager通过资源提供商(如YARN、Kubernetes)申请新的TaskManager。
  5. slot分配:ResourceManager将匹配的slot提供给JobManager。
  6. 任务部署:JobManager将任务部署到获得的slot中。

在这里插入图片描述

1、作用

基于FLIP-56(Dynamic Slot Allocation)实现,核心思想是按需申请不同规格的slot,最大化资源利用效率

2、case

final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();SlotSharingGroup ssgA = SlotSharingGroup.newBuilder("a").setCpuCores(1.0).setTaskHeapMemoryMB(100).build();SlotSharingGroup ssgB = SlotSharingGroup.newBuilder("b").setCpuCores(0.5).setTaskHeapMemoryMB(100).build();someStream.filter(...).slotSharingGroup("a") // Set the slot sharing group with name “a”
.map(...).slotSharingGroup(ssgB); // Directly set the slot sharing group with name and resource.env.registerSlotSharingGroup(ssgA);

3、核心实现

  • JobMaster/DefaultScheduler(资源使用者):
    负责生成 ExecutionGraph、计划 ExecutionVertex 的部署,向 SlotPool 发起分配请求;当使用完成后释放 slot。
  • SlotPool(Job 级别 slot 池):
    维护 Job 可用/已分配的物理/逻辑 slot 视图;若本地池不满足,会向 ResourceManager 的 SlotManager 请求已有 TaskExecutor 的空闲 slot(静态模式下仅在集群既有 TM 范围内调度)。
  • ResourceManager/SlotManager(集群级 slot 目录):
    聚合所有 TaskExecutor 的 slot 状态,处理 JobMaster 的请求,向目标 TaskExecutor 下发分配指令。静态模式下不会再去底层系统(YARN/K8s)扩容。
  • TaskExecutor(资源提供者):
    通过 SlotTable 维护本机 slot,响应 ResourceManager 的分配请求,最终以 offerSlot 的方式把已分配 slot 提供给 JobMaster 绑定并部署 Task。
  • SimpleExecutionSlotAllocator/SlotSharingExecutionSlotAllocator(共享策略):
    在同一 TM slot 上复用多个同 Job 的 subtasks;控制 slot 树与 Co-location、ResourceProfile 匹配与约束。

在这里插入图片描述

http://www.dtcms.com/a/395976.html

相关文章:

  • Final Cut Pro X fcpx音视频剪辑编辑(Mac中文)
  • 【LeetCode_88】合并两个有序数组
  • PromptPilot 发布:AI 提示词工程化新利器,首月零元体验
  • MySQL-详解数据库中的触发器
  • JVM调优实战及常量池详解
  • 字典树(Trie)
  • AI浏览器概述:Browser Use、Computer Use、Fellou
  • 「docker」三、3分钟快速安装docker
  • Altium Designer(AD)自定义PCB形状
  • 基于ZYNQ的创世SD NAND卡读写TXT文本实验
  • 文心快码入选2025人工智能AI4SE“银弹”标杆案例
  • 什么是SDN(Software Defined Netwok)
  • GitLab-如何基于现有项目仓库,复制出新的项目仓库
  • 本科大二第三周学习周报
  • 三、自定义Button模板触发器(纯XAML)
  • tar 将多个文件或目录打包成一个单独的归档文件
  • 2025新版 WSL2 + Docker Desktop 下载安装详细全流程指南 实现容器化管理,让开发效率起飞
  • 【LangChain4j】大模型实战-SpringBoot(阿里云百炼控制台)
  • Spring Security / Authorization Server 核心类中英文对照表
  • SqlHelper自定义的Sql工具类
  • 每周读书与学习->初识JMeter 元件(二)
  • 西门子 S7-200 SMART PLC 实操案例:中断程序的灵活应用定时中断实现模拟量滤波(上)
  • 测试分类(1)
  • 广州创科——湖北房县汪家河水库除险加固信息化工程(续集)
  • QT(5)
  • 仓颉语言宏(Cangjie Macros)全面解析:从基础到实战
  • linux RAID存储技术
  • 【每日一问】交流电和直流电有什么区别?
  • Postman使用指南
  • 软件架构面试题及答案