Zabbix监控K8S的PV卷
一、简介
在Kubernetes (K8S) 中,Persistent Volume (PV) 是集群中的一个抽象层,它代表了底层存储资源,例如网络存储系统(如NFS、Ceph、GlusterFS等)或本地存储(如硬盘驱动器、分区或目录)。PV 是集群级别的资源,可以被多个 Pod 共享,并且它的生命周期独立于任何使用它的 Pod。
当企业的 K8S 集群规模不断扩大和业务日益复杂时,其PV 卷的数量也在不断增加。PV 卷可能会出现容量不足、挂载异常、损坏等问题,这些问题如果不能及时发现和处理,可能会导致应用程序运行失败、数据丢失等严重后果。通过 Zabbix 对 K8S 的 PV 卷状态进行监控,我们可以实时获取 PV 卷的各项指标,提前预警潜在风险,保障业务的稳定运行。
二、K8S的Master上安装Zabbix Agent代理

三、检查PV命令

四、自定义监控脚本,将监控数据转换成JSON格式(LLD)
#!/bin/bash
echo -n '{"data": ['
kubectl get pv -o custom-columns=NAME:.metadata.name,STATUS:.status.phase --no-headers | \awk '{if(NR>1) printf ",";printf "{\"{#PV_NAME}\":\"%s\", \"{#PV_STATUS}\":\"%s\"}", $1, $2} END {print "]}"
}

五、Zabbix Agent代理中创建自定义key并重启Agent代理服务
UserParameter=kubernetes.pv.discovery,/home/zabbix_agents/scripts/get_k8s_pv.sh #自动发现key
UserParameter=kubernetes.pv.status[*],kubectl get pv $1 -o jsonpath='{.status.phase}' #状态值
六、监控配置比配置触发器
创建自定义自动发现监控项及监控项原型前面文章已说明,此处不过多阐述。
创建触发器(状态值为Failed或Pending触发告警)

丰富项目建设及落地经验和各类监控对象模板。欢迎一起交流探讨,解决你的技术难题!wechet:king_songax
