从学习搭建zabbix到完成各种监控、调优、二次开发已通过去了两年,期间经过QQ学习群、zabbix官方社区、各个技术博客整理学习了很多关于各类报错的处理方法,如今将常见的一些报错处理方法整理出来分享给你们。
在这先贴几个连接,给本身过去的简书增长些流量:
Centos7安装Zabbix server3.4
zabbix经过SNMP监控路由器,交换机
zabbix经过IPMI监控服务器硬件
zabbix agent部署及自定义SQL server监控模版
Zabbix+Raspberry pi监控机房温湿度
Zabbix监控服务器系统时间
zabbix监控Vmware运行
好了,广告打完,如今开始介绍常见报错处理方法:
问题1、Zabbix server内存溢出,没法启动
问题缘由:
这是因为zabbix默认的缓存配置只有8M,当你zabbix正常运行一段时间后,大批量添加一些被监控设备就会出现这种状况。
解决方法:
打开zabbix_server.conf文件,将CacheSize改一个较大的值,我如今给本身配的是1024M。java
vim /etc/zabbix/zabbix_server.conf
CacheSize=1024M #第385行
问题2、Zabbix housekeeper processes more than 75% busy
问题缘由:
因为zabbix天天都会产生大量数据(好比我如今监控项有20K+,每30s-5min每一个监控项会产生一条数据,一天会产生很是多数据),为了防止数据库爆炸,zabbix会自动按期清理历史数据(这个历史数据保留时间值你能够在监控项中本身配置),但清理历史数据会影响mysql性能,就会出现上面的报错。
解决方法:
这里须要调整两个参数,一个是清理时间间隔、一个是清理的最大删除量。mysql
vim /etc/zabbix/zabbix_server.conf
HousekeepingFrequency=12 #原值是每一小时清理一次,建议改成12或24小时清理一次。第363行 MaxHousekeeperDelete=100000 #原值为每次清理5000条,建议改成上限100000条。 第376行
问题3、Zabbix poller processes more than 75% busy
问题缘由:
这里可能有以下两个缘由:
一、经过Zabbix agent采集数据的设备死机或其余缘由致使zabbix agent死掉server获取不到数据。
二、server向agent获取数据时时间过长,超过了server设置的timeout时间。
解决方法:
一、增长zabbix server启动时初始化的进程数量:sql
vim /etc/zabbix/zabbix_server.conf
StartPollers=12 #第165行,视本身服务器性能改,上限是1000,若是改完发现启不起来能够改小一点。
二、修改模板自动发现规则中的保留失去的资源期间为0。
问题四:Zabbix discoverer processes more than 75% busy
问题缘由:
看问题报警字面意思是自动发现进程忙碌数超过75%,这是由于咱们用的监控模版中带着大量自动发现项,每个自动发现项都会产生一个进程,因此通常咱们添加多台被监控设备时就会出现这样的报错。
解决办法:
修改自动发现进程数。数据库
vim /etc/zabbix/zabbix_server.conf
StartDiscoverers=10 #第219行,取掉#号,默认为1,改成10,上限为250请视本身的需求和服务器配置而定
其次还能够经过执行按期重启server脚原本清理进程,释放内存。vim
[root@m01 ~]# grep 'StartDiscoverers' /etc/zabbix/zabbix_server.conf2 3 ### Option: StartDiscoverers4 5 StartDiscoverers=56 7 [root@m01 ~]# systemctl restart zabbix-server.service [root@m01 ~]# crontab -e2 3 @daily service zabbix-server restart > /dev/null 2>&14 5
问题五:Zabbix alerter processes more than 75% busy
问题缘由:
这个问题一般是由于邮件告警进程过于繁忙致使的,若是邮件动做间隔设置太短,在一些极端状况下(好比核心网络宕了)会发生大量邮件(好比上万条邮件)告警,则会致使邮件进程繁忙或者邮件进程直接挂了。
解决方法:
修改邮件脚本,将邮件的动做改成打印时间,等待邮件彻底释放再改回来,以下:缓存
[root@m01 ~]# cat /usr/lib/zabbix/alertscripts/sms 2 3 #!/bin/bash 4 5 echo `date` >>/tmp/sms.txt
问题六:Zabbix poller processes more than 75% busy
问题缘由:
一、zabbix消耗的内存过多。
二、某个进程卡住了。
三、僵尸进程太多、出错、致使慢了。
四、网络延时。
解决方案:
这里有两个解决方案,第一是修改zabbix_server.conf文件调优性能,第二是简单粗暴按期重启server释放进程。ruby
vim /etc/zabbix/zabbix_server.conf
StartPollers=12 #第165行,我如今设置为12,若是你服务器性可以强能够继续增长,上限是1000
其次是简单粗暴按期重启bash
service zabbix-server restart
crontab -e 调出Cron编辑器中增长一个计划:
@daily service zabbix-server restart > /dev/null 2>&1
问题七:server端日志中出现大量first network error, wait for 15 seconds
问题缘由:
产生这个问题的主要缘由是你的监控项执行时间过长,超过了默认配置的timeout=15s时间,这里只要将你的server、proxy和agent的conf文件中的timeout时间改长一点便可,上限是30s,若是30s还不够那就要改系统源码来突破这个上限了。
解决方法:服务器
vim /etc/zabbix/zabbix_server.conf #这里以修改server端conf文件为例,其余两个相似的就不列举了 Timeout=30 #第448行
问题八:More than 100 items having missing data for more than 10 minutes和Zabbix poller processes more than 75% busy
问题缘由:
这两个问题的主要缘由是你配置的缓存或者进程数太少,致使监控项不少时服务器来不及处理。
解决方法:
直接增长server端进程数和缓存便可。网络
vim /etc/zabbix/zabbix_server.conf
StartPollers=500
StartPollersUnreachable=50
StartTrappers=30
StartDiscoverers=6
CacheSize=1G
CacheUpdateFrequency=300
StartDBSyncers=20
HistoryCacheSize=512M
TrendCacheSize=256M
HistoryTextCacheSize=80M
ValueCacheSize=1G #这里把关于该问题的可能性能项配置一块儿给到你们
问题九:connection to database 'zabbix' failed: [1040] Too many connections
问题缘由:
从字面意思上能够看出数据库的链接数已经超出最大限制。
解决方法:
直接修改mysql的最大链接数便可。
vim /etc/my.cnf
max_connections=1000 #将最大连接数调整为1000 systemctl restart mariadb.service #重启SQL
问题十:批量添加大量被监控设备后出现服务端直接宕机,报警提示Zabbix value cache working in low memory mode Less than 25% free in the configuration cache。
问题缘由:
因为大量添加被监控设备,致使服务器内存溢出。
解决方案:
vim /etc/zabbix/zabbix_server.conf
CacheSize=1024M #第385行
问题十一:Zabbix alerter processes more than 75% busy
问题缘由:
从字面意思能够看出当你产生大量告警是即会出现这个报错,告警进程过多。
解决方案:
调整conf文件中的最大告警进程数便可。
vim /etc/zabbix/zabbix_server.conf
StartAlerters=3 #第254行,去掉#注释,修改成10,上限为100。
问题十二:zabbix unreachable poller processes more than 75 busy
问题缘由:
产生这个问题的主要缘由是zabbix server端轮询的不可达设备(被监控设备处于死机状态、agent与server数据传输超过timeout时间、mysql或zabbix server的io卡住了)过多致使。
解决方案:
vim /etc/zabbix/zabbix_server.conf
StartPingers=12 #第165行,修改成12,上限是1000
以上这些基本都是由于zabbix的zabbix_server.conf文件中的默认性能配置太低致使的错误,在平常使用中常常会遇到,只要进行简单配置后从新启动zabbix server便可解决。该贴会持续不按期更新我平常工做中遇到的各类问题。