Zabbix优化指南:提升监控效率与性能
zabbix是一款功能强大的开源监控解决方案,广泛应用于各种规模的企业和组织中。然而,随着监控需求的增长和环境复杂性的增加,如何优化Zabbix的性能成为许多用户关注的重点。本文将探讨一些关键的优化策略,帮助你提高Zabbix的运行效率,确保其在高负载下也能稳定工作。
标题zabbix 优化
优化方法
官方文档
https://blog.zabbix.com/monitoring-how-busy-zabbix-processes-are/457/
如果主机和监控项众多, Zabbix Server 有可能会出现的性能问题,主要表现如下: Web 管理页面操作卡顿,经常出现502错误,监控图形中图层断裂,监控告警不及时
可以查看队列了解 Zabbix 性能状态
管理-- 队列
优化方法
数据库: 写多读少,数据采集比较频繁,可以考虑 PostgreSQL
使用主动模式,减轻 Zabbix Server压力
如果需要监控远程主机,使用 Zabbix Proxy
删除无用监控项,建议使用自定义的模板和监控项
适当增加监控项的取值间隔,减少历史数据保存周期,此工作由housekeeper进程定时清理
针对 Zabbix历史数据和趋势图的数据表,进行周期性分表保存
对 Zabbix Server 进程调优,发现性能瓶颈的进程,加大它的进程数量
对 Zabbix Server 缓存调优,发现哪种缓存的剩余内存少,就加大它的缓存值
标题数据库空间估算
监控项的保留时长,历史数据默认90天,趋势数据1年
官方公式
https://www.zabbix.com/documentation/7.0/zh/manual/installation/requirements
配置文件数据+ 历史数据+ 趋势数据+ 事件数据
假设 100台主机,每个主机约有100个监控项,每个监控项每间隔60s获取一次数值
#历史数据:
days*(items/refresh rate)*24*3600*bytes
90*(10000/60)*24*3600*90=116173440000 字节 约共116GB#趋势:
days*(items/3600)*24*3600*bytes
365*(10000/3600)*24*3600*90=5676480000 字节 约共5G#事件:
days*events*24*3600*bytes
365*1*24*3600*170=5361120000 约5G#合计:126GB
Zabbix Server 配置文件解析
AlertScriptsPath
默认值:/usr/local/share/zabbix/alertscripts
说明:告警脚本目录AllowRoot
默认值:0 说明:是否允许使用root启动,0:不允许,1:允许,默认情况下她会使用zabbix用户来启动
zabbix进程,不推荐使用rootCacheSize
取值范围: 128K-8G
默认值:8M
说明:配置缓存,用于存储host,item,trigger数据,2.2.3版本之前最大支持2G,目前最大支持
8G,zabbix5.0最大支持64G
Zabbix6.0 默认值32MCacheUpdateFrequency
取值范围:1-3600
默认值:60
说明:多少秒更新一次配置缓存DBHost
默认值:localhost
说明:数据库主机地址
DBName
默认值:无
必填:是DBPassword:
默认值:无
说明:数据库密码DBPort
取值范围:1024-65535
默认值:3306
说明:SQLite作为DB,这个选项请忽略,如果使用socket链接,也请忽略。DBSchema
说明:Schema名称. 用于 IBM DB2 、 PostgreSQL.DBSocket
默认值:/tmp/mysql.sock
说明:mysql sock文件路径DebugLevel
取值范围:0-5
默认值:3
说明: 指定debug级别
0 - 基本信息
1 - critical信息
2 - error信息
3<