03三大支柱:指标(Metrics)、日志(Logs)、追踪(Tracing)
在构建现代服务监控系统时,我们需要解决两个核心问题:系统出了什么问题? 以及问题出在哪里? 为了回答这两个问题,业界提出了监控的三大支柱:指标(Metrics)、日志(Logs) 和 追踪(Tracing)。
这三大支柱从不同维度帮助技术团队全面了解系统运行状态。指标负责量化系统性能,日志记录事件详情,追踪揭示服务间调用链的动态。本篇文章将详细介绍这三大支柱的定义、特点、适用场景,以及它们在监控系统中的作用。
指标(Metrics)
指标(Metrics) 是对系统运行状态的量化描述,通常以时序数据的形式表示。指标以固定时间间隔采集,反映某个维度的性能或资源使用情况。
常见的指标类型
1)系统资源指标:如 CPU 使用率、内存占用、磁盘 I/O。
2)应用性能指标:如响应时间、QPS(每秒请求数)、错误率。
3)业务指标:如订单量、支付成功率等与业务相关的数据。