当前位置: 首页 > news >正文

一种Spark程序运行指标的采集与任务诊断实现方式

一种Spark程序运行指标的采集与任务诊断实现方式

编写时间:2023年8月2日

第一次校准时间:2023年8月2日

文章目录

  • 一种Spark程序运行指标的采集与任务诊断实现方式
    • 数据链路
    • 采集器的类图
    • CustomSparkListener采集的指标
      • task相关
      • stage相关
      • Job相关
      • Executors相关
    • 诊断
      • 诊断分类
        • 调度阶段诊断
        • 周期性诊断
        • 应用结束诊断
      • 诊断报告
    • 附录 Spark程序的运行监听器
        • **SparkListener**
        • **StreamingListener**接口

数据链路

  1. spark-metrics-collector.jar 作为Spark运行扩展包部署在Spark上,在Spark程序运行时,在SparkContext中将CustomSparkListener监听器注册到listenerBus中。进行任务的跟踪、指标采集与诊断。同理在StreamingContext中将CustomStreamingListener监听器注册到StreamingListenerBus中,对流式任务的跟踪、指标采集与诊断。
  2. 通过监听器将程序运行是的相关指标进行采集、诊断后发送到指标的统一接收端(DMA),做数据删选后,写入对应的Kafka的Topic中。
  3. 通过消费对应的Topic,将相关数据存入分析系统中。

采集器的类图

离线任务采集

http://www.dtcms.com/a/153436.html

相关文章:

  • win11什么都不动之后一段时间黑屏桌面无法显示,但鼠标仍可移动,得要熄屏之后才能进入的四种解决方法
  • MCP‌和LangGraph‌结合
  • Python 函数与模块
  • 开关量扫描处理(消抖)
  • Linux平台实现低延迟的RTSP、RTMP播放
  • Java技术体系的主要产品线详解
  • 专家系统的基本概念解析——基于《人工智能原理与方法》的深度拓展
  • 车载客流记录仪简介
  • 2025 年免费 Word 转 PDF 转换器有哪些?
  • 数据结构——二叉树,堆
  • 【硬核干货】SonarQube安全功能
  • 【动手学深度学习】ResNet残差网络
  • ragflow部署以及api调用整理
  • 创新项目实训开发日志4
  • 第十七届山东省职业院校技能大赛 中职组网络建设与运维赛项
  • 一天学完Servlet!!!(万字总结)
  • 第五章:Framework/Tooling Abstraction
  • CS144 Lab5 实战记录:网络接口实现 ARP
  • Spring Boot Controller 单元测试撰写
  • Git删除指定历史版本
  • 快速配置linux远程开发-go语言
  • Docker部署DeepSeek常见问题及解决方案
  • 实战交易策略 篇十九:君山居士熊市交易策略
  • 机器学习 Day14 XGboost(极端梯度提升树)算法
  • 得物业务参数配置中心架构综述
  • 大语言模型之提示词技巧
  • Tomcat:从零理解Java Web应用的“心脏”
  • 路由交换网络专题 | 第七章 | BGP练习 | 次优路径 | Route-Policy | BGP认证
  • Typecho 访客统计插件最新版-前后台统计图均可显示
  • 搭建私人网站