当前位置: 首页 > news >正文

Argocd 运维与最佳实践

Argocd 运维与最佳实践


Argo CD 的可观测性:监控你的控制平面

Argo CD 是我们持续交付的“大脑”和“中枢神经”,它的健康状况至关重要。我们必须像对待任何一个核心生产服务一样,对它建立完善的可观测性。

A. Prometheus 指标 (Prometheus Metrics)

Argo CD 的核心组件(API Server, Repo Server, Application Controller)都原生暴露了大量丰富的 Prometheus 格式的指标。

  • 如何暴露和抓取: Argo CD 的 argocd-metrics Service(端口 8082)和 argocd-repo-server-metrics Service(端口 8084)专门用于暴露这些指标。你需要在 Prometheus 的配置中添加相应的 scrape jobs 来抓取它们。

  • SRE 需要关注的关键指标:

    • argocd_app_sync_total: 应用同步操作的总次数。通过 rate() 函数可以计算出同步频率。
    • argocd_app_sync_latency_seconds_bucket: 应用同步操作的延迟分布。可以用来计算 P95/P99 同步延迟。
    • argocd_app_info: 这是一个非常有用的指标,它通过标签 (label) 暴露了每个应用的健康状态 (health_status) 和同步状态 (sync_status)。我们可以用它来告警:
      • count(argocd_app_info{health_status!="Healthy"}): 计算处于非健康状态的应用数量。
      • count(argocd_app_info{sync_status!="Synced"}): 计算处于失步状态的应用数量。
    • argocd_cluster_connection_status: Argo CD 与其所管理的目标集群的连接状态。
    • argocd_repo_server_request_latency_seconds_bucket: Git 仓库操作(如 git fetch)的延迟。

相关文章:

  • 【uniapp】小程序中input输入框的placeholder-class不生效
  • 【C++】来学习使用set和map吧
  • matlab分布式电源微电网潮流
  • DAS-U250高性能分布式光纤声波传感器
  • Spring @Scope, @Lazy, @DependsOn, @Required, @Lookup
  • 机器学习核心概念速览
  • Springboot项目的目录结构
  • AI赋能Automa二次开发
  • Spring @Qualifier,@Primary
  • 分布式ID实现方案实战示例总结
  • 【Zephyr 系列 18】分布式传感网络系统设计:从 BLE Mesh 到边缘网关的数据闭环
  • 看安科瑞分布式光伏解决方案如何破解光伏痛点?
  • 机器学习赋能的智能光子学器件系统研究与应用
  • 基于生成对抗网络(GAN)的图像生成与编辑:原理、应用与实践
  • Idea 2025 commit 关闭侧边栏 开启探框
  • SHA-1算法详解:原理、特点与应用
  • OctoPrint公网部署如何实现?3D打印远程控制一键部署过程!
  • 牛市与熊市:市场周期的双面镜
  • 记录下three.js学习过程中不理解问题----材质(material)⑤
  • NLP学习路线图(三十九):对话系统
  • 可以做盗版漫画网站吗/做关键词优化
  • 张家港企业做网站/百度账号申请注册
  • wordpress 添加点赞/如何做网站推广优化
  • 做网站让用seo刷新是哪个键/重庆网站推广
  • html 模板网站/网络营销课程个人总结3000字
  • 波波网站建设/刷赞抖音推广网站