Zabbix 配置钉钉告警
在企业级运维监控中,Zabbix 是一个功能强大的开源监控工具。为了实现告警信息的实时推送,将 Zabbix 与钉钉机器人集成是一种高效、便捷的方案。本文将详细介绍如何在 Zabbix 中配置钉钉告警,实现故障告警和恢复通知的自动化推送。
一、钉钉机器人配置
1. 创建钉钉群聊
首先,登录钉钉,创建一个用于接收告警信息的内部群聊。
- 打开钉钉客户端,点击“发起群聊”。
- 选择“内部群”,添加需要接收告警的成员。
- 设置群名称,例如:Zabbix 告警通知群。
2. 添加自定义机器人
进入刚创建的群聊,点击右上角的“群设置”图标(齿轮图标),然后选择“智能群助手” → “添加机器人” → “自定义机器人”。
- 设置机器人名称,例如:Zabbix告警机器人。
- 选择“加签”方式(推荐),并复制生成的 Webhook URL。
- 请务必保存该 URL,后续 Zabbix 脚本中将使用它。
二、Zabbix 服务器端配置
1. 安装 Python 依赖
确保 Zabbix 服务器已安装 Python3 及 requests
模块,用于发送 HTTP 请求。
sudo apt update # 更新软件包索引
sudo apt install -y python3 python3-pip # 安装 Python3 和 pip
sudo pip3 install requests # 安装 requests 模块(用于发送 HTTP 请求)
2. 创建告警脚本
在 Zabbix 的脚本目录下创建钉钉告警脚本。
sudo nano /usr/local/zabbix/share/zabbix/alertscripts/dingtalk_alert.py
将以下 Python 脚本内容写入文件:
#!/usr/bin/env python
# -- coding: utf-8 --import json
import requests
import sys# 钉钉机器人Webhook地址
Dingtalkaccesstoken = "144f44aac70ffa1f0cb79d217649faa726a26596640792132e0d9d4c11630528" # 替换为你的钉钉机器人accesstoken
webhook = "https://oapi.dingtalk.com/robot/send?access_token=" + Dingtalkaccesstokendef formatmessage(title, content):message_template = "{}\n{}".format(title, content)return message_templatedef sendmsg(title, content):headers = {'Content-Type': 'application/json'}message = formatmessage(title, content)data = {"msgtype": "text","text": {"content": message}}try:response = requests.post(webhook, headers=headers, data=json.dumps(data))return response.status_codeexcept Exception as e:print("发送失败,错误信息:", e)return Noneif __name__ == "__main__":if len(sys.argv) < 3:print("使用方法:python dingtalkalert.py '标题' '内容'")sys.exit(1)title = sys.argv[1]content = sys.argv[2]status_code = sendmsg(title, content)if status_code == 200:print("消息发送成功")else:print("消息发送失败,状态码:", status_code)
3. 设置脚本权限与属主
确保 Zabbix 服务能正常执行该脚本。
sudo chmod +x /usr/local/zabbix/share/zabbix/alertscripts/dingtalk_alert.py # 添加执行权限
sudo chown -R zabbix:zabbix /usr/local/zabbix/share/zabbix/alertscripts/ # 修改属主为 zabbix 用户
4. 配置 Zabbix 服务器
编辑 Zabbix 服务配置文件,确认脚本路径正确。
sudo nano /usr/local/zabbix/etc/zabbix_server.conf
确保包含以下配置项:
AlertScriptsPath=/usr/local/zabbix/share/zabbix/alertscripts
5. 重启 Zabbix 服务
sudo systemctl restart zabbix-server
6. 测试脚本功能
执行脚本测试是否能成功发送消息。
python3 /usr/local/zabbix/share/zabbix/alertscripts/dingtalk_alert.py "测试标题" "告警"
三、Zabbix Web 界面配置
1. 创建告警媒介类型
登录 Zabbix Web 界面,进入: 管理 → 报警媒介类型 → 创建媒介类型
- 名称:
DingTalk alarm
- 类型:脚本
- 脚本名称:
dingtalk_alert.py
- 脚本参数:
{ALERT.SUBJECT}
{ALERT.MESSAGE}
{ALERT.SENDTO}
2. 为用户添加告警媒介
进入: 管理 → 用户 → 选择用户(如 Admin)→ 报警媒介 → 添加
- 类型:DingTalk alarm
- 收件人:可填写
zabbix@company.com
或任意标识 - 启用:勾选
3. 创建告警动作
进入: 配置 → 动作 → 触发器动作 → 创建动作
基本信息
- 名称:
Send Alert to DingTalk
操作(告警时)
- 操作:添加
- 仅送到:选择
DingTalk alarm
主题:
🚨 故障告警:{HOSTNAME1} 发生 {TRIGGER.NAME}
消息:
🔴 告警主机: {HOSTNAME1}主机地址: {HOST.IP}告警等级: {TRIGGER.SEVERITY}监控项目: {TRIGGER.KEY1}问题详情: {ITEM.NAME} = {ITEM.VALUE}当前状态: {TRIGGER.STATUS}告警信息: {TRIGGER.NAME}告警时间: {EVENT.DATE} {EVENT.TIME}事件ID: {EVENT.ID}
恢复操作
- 添加
- 仅送到:DingTalk alarm
主题:
✅ 恢复通知:{HOSTNAME1} 的 {TRIGGER.NAME} 已恢复
消息:
🟢 恢复主机: {HOSTNAME1}主机地址: {HOST.IP}告警等级: {TRIGGER.SEVERITY}监控项目: {TRIGGER.KEY1}问题详情: {ITEM.NAME} = {ITEM.VALUE}(已恢复正常)当前状态: {TRIGGER.STATUS}告警信息: {TRIGGER.NAME}(已恢复)恢复时间: {EVENT.DATE} {EVENT.TIME}事件ID: {EVENT.ID}
四、测试与验证
- 手动触发一个监控项告警(如停止 nginx 服务)。
- 查看钉钉群是否收到告警消息。
- 恢复服务,确认是否收到恢复通知。
五、常见问题排查
问题 | 可能原因 | 解决方案 |
---|---|---|
消息未发送 | 脚本无执行权限 | 使用 chmod +x 添加权限 |
发送失败 | access_token 错误 | 检查 Webhook URL 是否正确 |
Zabbix 找不到脚本 | 路径配置错误 | 确认 AlertScriptsPath 正确 |
机器人被禁用 | 频繁发送或违规 | 检查钉钉机器人状态 |
本文基于 Ubuntu 系统,完整演示了 Zabbix 与钉钉机器人的集成流程。通过脚本化告警推送,实现了监控告警的即时触达,极大提升了运维响应效率。建议结合加签机制、消息模板优化和定期测试,确保告警系统的稳定可靠。