当前位置: 首页 > news >正文

docker-compose搭建prometheus以及grafana

1. 什么是 Prometheus?

Prometheus 是一个开源的系统监控和告警工具,由 SoundCloud 于 2012 年开始开发,现为 CNCF(Cloud Native Computing Foundation)项目之一。它特别适合云原生环境和容器编排系统(如 Kubernetes)的监控。

Prometheus 的核心特点:

  • 多维数据模型:时间序列数据带有标签(key-value),支持灵活查询。

  • 拉模式采集:Prometheus 定期从被监控服务拉取指标数据。

  • 强大的查询语言 PromQL:支持丰富的指标计算和聚合。

  • 内置时序数据库:高效存储监控指标。

  • 支持告警管理:结合 Alertmanager 实现告警规则和通知。

  • 生态丰富:有多种导出器(exporters)可采集不同系统和应用指标。

2. Prometheus 工作原理

采集数据

Prometheus 通过 HTTP 协议周期性地拉取被监控目标的指标数据。被监控程序需要暴露符合 Prometheus 格式的指标端点(通常是 /metrics),例如:

  • node-exporter:采集 Linux 主机的系统指标(CPU、内存、磁盘、网络等)

  • cadvisor:采集容器指标

  • 应用自带的 metrics endpoint:Java、Go、Python 等语言有对应的客户端库,方便开发者直接暴露应用指标。

存储数据

Prometheus 自带高效的时序数据库,将采集到的指标以时间序列形式存储,支持数据压缩和快速检索。

查询和告警

使用 PromQL 查询语言,用户可以对指标做聚合、过滤、算术运算等操作,实现灵活的监控仪表盘和告警规则。

3. Prometheus 生态组件

  • Prometheus Server:核心组件,负责采集、存储和查询数据。

  • Exporters:辅助采集各种系统和服务指标的程序。例如:

    • node-exporter:主机资源监控

    • cadvisor:容器监控

    • mysqld-exporter:MySQL 监控

    • blackbox-exporter:HTTP、TCP 服务可用性探测

  • Alertmanager:管理告警规则,支持邮件、钉钉、微信、Slack 等多种通知方式。

  • Pushgateway:用于无法被 Prometheus 拉取指标的短暂任务推送指标。

  • Grafana:流行的开源可视化平台,通常与 Prometheus 配合使用,展示图表和告警。

4. Prometheus 的优势

  • 开箱即用:提供多种官方和第三方 Exporters,快速覆盖多种场景。

  • 灵活的指标模型和查询语言:支持多维标签,适合复杂业务监控需求。

  • 高度可扩展:支持服务发现,自动监控大规模集群。

  • 活跃社区和丰富文档:持续更新和优化。

5. 典型监控架构示例

graph LRPrometheus -->|Scrape metrics| ExportersExporters -->|Expose metrics| LinuxHostExporters -->|Expose metrics| ContainersExporters -->|Expose metrics| DatabasesPrometheus -->|Store & Query| TSDBPrometheus -->|Alert rules| AlertmanagerAlertmanager -->|Send alerts| NotificationChannelsPrometheus -->|Provide data| GrafanaGrafana -->|Visualize dashboards| Users

6. 结合 Grafana 的优势

Grafana 专注于数据可视化,支持多种数据源,包括 Prometheus。配合 Prometheus,Grafana 提供:

  • 灵活的图表和仪表盘定制

  • 实时监控界面

  • 告警通知管理

  • 多用户权限控制

一、搭建环境准备

主机ip角色软件
主机1192.168.1.30服务端        Prometheus、node-exporter、cadvisor、Grafana
主机2192.168.1.29客户端node-exporter、cadvisor

二、安装docker和docker-compose

这个在我前几期有,小白可以去看下,了解下

三、部署prometheus与grafana

创建prometheus目录 然后创建prometheus.yml

mkdir /data/prometheus && cd /data/prometheus
vim prometheus.yml
global:scrape_interval:     15sevaluation_interval: 15salerting:alertmanagers:- static_configs:- targets: ['192.168.1.30:9093']rule_files:- "node_down.yml"scrape_configs:- job_name: 'prometheus'static_configs:- targets: ['192.168.1.30:9090']- job_name: 'node'scrape_interval: 8sstatic_configs:- targets: ['192.168.1.30:9100', '192.168.1.29:9100']- job_name: 'cadvisor'scrape_interval: 8sstatic_configs:- targets: ['192.168.1.30:8088', '192.168.1.29:8088']

创建node_down.yml

vim node_down.yml
groups:
- name: node_downrules:- alert: InstanceDownexpr: up == 0for: 1mlabels:user: testannotations:summary: "Instance {{ $labels.instance }} down"description: "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 1 minutes."

然后创建服务端compose文件

vim docker-compose-prometheus.ymlversion: '2'networks:monitor:driver: bridgeservices:prometheus:image: prom/prometheuscontainer_name: prometheushostname: prometheusrestart: alwaysvolumes:- /data/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml- /data/prometheus/node_down.yml:/etc/prometheus/node_down.ymlports:- "9090:9090"networks:- monitorgrafana:image: grafana/grafanacontainer_name: grafanahostname: grafanarestart: alwaysports:- "3000:3000"networks:- monitornode-exporter:image: quay.io/prometheus/node-exportercontainer_name: node-exporterhostname: node-exporterrestart: alwaysports:- "9100:9100"networks:- monitorcadvisor:image: google/cadvisor:latestcontainer_name: cadvisorhostname: cadvisorrestart: alwaysvolumes:- /:/rootfs:ro- /var/run:/var/run:rw- /sys:/sys:ro- /var/lib/docker/:/var/lib/docker:roports:- "8088:8080"networks:- monitor

然后docker-compose -f docker-compose-prometheus.yml up -d启动

在客户端创建docker-compose文件

vim docker-compose.ymlversion: '2'networks:monitor:driver: bridgeservices:node-exporter:image: quay.io/prometheus/node-exportercontainer_name: node-exporterhostname: node-exporterrestart: alwaysports:- "9100:9100"networks:- monitorcadvisor:image: google/cadvisor:latest#image:swr.cn-north-4.myhuaweicloud.com/ddn-k8s/gcr.io/cadvisor/cadvisor:v0.51.0-linuxarm64         ##arm架构的可以用下面这个镜像  container_name: cadvisorhostname: cadvisorrestart: alwaysvolumes:- /:/rootfs:ro- /var/run:/var/run:rw- /sys:/sys:ro- /var/lib/docker/:/var/lib/docker:roports:- "8088:8080"networks:- monitor

然后docker-compose up -d启动

浏览器访问http://192.168.1.30:9090/targets

四、配置grafana

http://192.168.1.30:3000/ 浏览器访问

账号密码是admin/admin   登录会让你修改   如果不修改跳过即可

配置的话就不多说了 比较简单  先添加prometheus数据源 然后再面板 导入数字添加即可

相关文章:

  • manus对比ChatGPT-Deep reaserch进行研究类论文数据分析!谁更胜一筹?
  • 【后端高阶面经:架构篇】50、数据存储架构:如何改善系统的数据存储能力?
  • Ubuntu 22.04 系统下 Docker 安装与配置全指南
  • Python中openpyxl库的基础解析与代码实例
  • 微信小店推客系统达人用户管理的数据支持和便利
  • window10下docker方式安装dify步骤
  • Leetcode 2005. 斐波那契树的移除子树游戏
  • 【算法提升】分组 day_tow
  • 【Doris基础】Apache Doris业务场景全解析:从实时数仓到OLAP分析的完美选择
  • ECS-7000能耗监测系统能耗数据管理机
  • iEKF的二维应用实例
  • 产品更新|数字主线深度解析:华望解决方案助力企业数字化转型
  • RabbitMQ和MQTT区别与应用
  • 粽叶飘香时 山水有相逢
  • 【动手学深度学习】2.5. 自动微分
  • 北京大学肖臻老师《区块链技术与应用》公开课:06-BTC-网络
  • PSpice软件快速入门系列--07.如何进行Worst Case最坏情况分析
  • TypeScript 中感叹号(!)两种位置用法
  • 基于粒子滤波的PSK信号解调实现
  • C#上传图片后压缩
  • 河南省住房和城乡建设厅查询网站/自媒体发布平台
  • 衢州市住房建设局 网站/国内打开google网页的方法
  • wordpress收录难/旅游seo整站优化
  • 学生管理系统 网站开发/网站建设网络公司
  • 免费做司考真题的网站/近期国际热点大事件
  • 导视标识设计/学seo建网站