Zabbix2.0后,自带的Template OS Linux模版中 Processor load检测的值为percpu,即每个CPU的load,若是为多核CPU的话,这里获取到的值就不是所有CPU的,天然与在系统中执行uptime命令获取到的load值不符, 而且模版中自带触发器的报警阈值也至关高,没记错的话应该是4仍是5,这就形成一个状况,明明机器的CPU负载很高,Zabbix确不报警,此是大坑之一..解决办法有两个(使用其中一个便可):
spa
- 将Processor load的键值修改成检测全部CPU,将其中的percpu修改成all便可,注意默认模版有三个监控项
Processor load (1 min average per core)
Processor load (5 min average per core)
Processor load (15 min average per core)
- 下降触发器的报警阈值,默认模版只带了一个触发器,修改触发器表达式为(我这里改为了1.5,即单个CPU的load超过1.5即报警):
{Template OS Linux:system.cpu.load[percpu,avg1].avg(5m)}>1.5