Zabbix监控Windows进程重启

    前段时间,一个朋友咨询我怎么监控Windows进程的重启。生产环境有监控进程的启动和关闭,但重启还没想过。通过一番思考和摸索后成功完成了监控,下面把监控思路和方法分享给你们。
windows

    我首先想到的是经过Zabbix自带的进程数监控(proc.num)来作,但有两个难点:1、进程数从1变为0再变为1,算是一次重启。触发器要判断三次连续的监控数据,不太好作;2、进程从关闭到下次启动,中间间隔多长时间算是一次重启呢?服务器

    而后想到了zabbix监控操做系统的重启,好比Windows系统重启的触发器:{Template OS Windows:system.uptime.change(0)}<0,zabbix是经过监控系统运行时长来判断的,即系统运行时长的变化小于0就能够判定服务器重启了。一样的,若是咱们监控了进程的运行时长,那么重启就很好判断了。ide

    下一步着手监控Windows进程的运行时长。想到了zabbix原生支持监控Windows performance counters(Windows性能监视器),能够从Windows性能监视器里面查找是否有对进程运行时长的监控。登陆一台Windows Server 2008服务器,上去查看一下性能监视器,还真找到了,见下图:性能

wKioL1klGrTgRb43AAGrAlpJ8eM644.png-wh_50

    从Process类别里找到了“Elapsed Time”,这就是进程总运行时间的意思。再从下面一栏选择一个进程(好比zabbix_agentd,不带.exe后缀)。测试

    添加好后,右键选择“属性”:spa

wKiom1klGuzC5z1QAAAz7F6QKCg286.png-wh_50

    能够看到咱们刚才添加的计数器为:\Process(zabbix_agentd)\Elapsed Time操作系统

wKiom1klGwWwNFkzAADGEDPW4go666.png-wh_50

    退出设置,而后查看计数器的数据,进程当前运行时长14349806秒:3d

wKioL1klGzHCz2yOAADtxh2g8W0200.png-wh_50

    重启进程zabbix_agentd,再观察一下,最新计数从0开始了:orm

wKiom1klG06Q3EsYAAAV5SBccAA566.png-wh_50

    方法找到了,咱们建立监控项和触发器。博客地址:http://qicheng0211.blog.51cto.com/blog

    先建立监控项:

wKioL1klG5igLvl2AAFJviy7PL8131.png-wh_50

    监控项名称:zabbix_agentd进程运行时间

    监控项类型:Zabbix agent

    监控项Key:perf_counter["\Process(zabbix_agentd)\Elapsed Time"]

    数据类型:float

    单位:s

    监控间隔:30

    注:perf_counter的参数就是上面添加的性能计数器。

    建立触发器:

wKioL1klG7GQ8qzPAADENYlMhhM484.png-wh_50

    触发器名字:zabbix_agentd进程重启!

    触发器表达式:{windows.60.61:perf_counter["\Process(zabbix_agentd)\Elapsed Time"].change()}<0

    表达式含义:监控项最新监控数据和上一个数据的差值小于0,则触发器触发。

    下面咱们测试一下,重启进程后观察是否产生告警:

wKiom1klG93gzBvgAAD8VFTIoTU288.png-wh_50

    等待一会,触发器成功被触发,触发状态持续30秒。

wKiom1klG_bAEUdjAACBpY5Y-dw813.png-wh_50

    到这咱们对Windows进程重启的监控就完成了。

    原创文章,转载请注明出处,尊重博主劳动成果,感谢。

相关文章
相关标签/搜索