当前位置: 首页 > news >正文

一种Spark程序运行指标的采集与任务诊断实现方式

一种Spark程序运行指标的采集与任务诊断实现方式

编写时间:2023年8月2日

第一次校准时间:2023年8月2日

文章目录

  • 一种Spark程序运行指标的采集与任务诊断实现方式
    • 数据链路
    • 采集器的类图
    • CustomSparkListener采集的指标
      • task相关
      • stage相关
      • Job相关
      • Executors相关
    • 诊断
      • 诊断分类
        • 调度阶段诊断
        • 周期性诊断
        • 应用结束诊断
      • 诊断报告
    • 附录 Spark程序的运行监听器
        • **SparkListener**
        • **StreamingListener**接口

数据链路

  1. spark-metrics-collector.jar 作为Spark运行扩展包部署在Spark上,在Spark程序运行时,在SparkContext中将CustomSparkListener监听器注册到listenerBus中。进行任务的跟踪、指标采集与诊断。同理在StreamingContext中将CustomStreamingListener监听器注册到StreamingListenerBus中,对流式任务的跟踪、指标采集与诊断。
  2. 通过监听器将程序运行是的相关指标进行采集、诊断后发送到指标的统一接收端(DMA),做数据删选后,写入对应的Kafka的Topic中。
  3. 通过消费对应的Topic,将相关数据存入分析系统中。

采集器的类图

离线任务采集

相关文章:

  • win11什么都不动之后一段时间黑屏桌面无法显示,但鼠标仍可移动,得要熄屏之后才能进入的四种解决方法
  • MCP‌和LangGraph‌结合
  • Python 函数与模块
  • 开关量扫描处理(消抖)
  • Linux平台实现低延迟的RTSP、RTMP播放
  • Java技术体系的主要产品线详解
  • 专家系统的基本概念解析——基于《人工智能原理与方法》的深度拓展
  • 车载客流记录仪简介
  • 2025 年免费 Word 转 PDF 转换器有哪些?
  • 数据结构——二叉树,堆
  • 【硬核干货】SonarQube安全功能
  • 【动手学深度学习】ResNet残差网络
  • ragflow部署以及api调用整理
  • 创新项目实训开发日志4
  • 第十七届山东省职业院校技能大赛 中职组网络建设与运维赛项
  • 一天学完Servlet!!!(万字总结)
  • 第五章:Framework/Tooling Abstraction
  • CS144 Lab5 实战记录:网络接口实现 ARP
  • Spring Boot Controller 单元测试撰写
  • Git删除指定历史版本
  • 2025财政观察①长三角罚没收入增速放缓,24城仍在上涨
  • 看纪录片抵学分,贺桂梅:纪录片是对抗低质碎片信息的好媒介
  • 同日哑火丢冠,双骄的下山路,手牵手一起走
  • 五一期间全国高速日均流量6200万辆,同比增长8.1%
  • 澎湃读报丨央媒头版集中刊发社论,庆祝“五一”国际劳动节
  • 马上评|扩大高速免费救援范围,打消出行后顾之忧