Zabbix 完整的监控流程

                   Zabbix完整的监控流程node


前面学习了zabbix的工做原理和安装方法,今天咱们学习zabbix 添加监控主机:tcp


    一、添加一台主机( 配置--主机--添加主机)ide


wKioL1l0WAeiLRFqAAC9QI1gqHM991.png-wh_50

wKioL1l0WPei3vCYAAHbL8m_Nkg550.jpg-wh_50

这样 node2 就被添加上来了。学习


  二、添加node2 的应用集(aplication)spa

  选择node2 应用集--建立应用集--名称为cpu stats  (再建立一个memory stats)
3d

wKiom1l0WZrDGPFEAABWz8vOw94352.jpg-wh_50

wKiom1l0WmThF9aaAACNL2yKz_0889.jpg-wh_50


    三、添加item (选择node2 item--建立item)blog

wKiom1l0XxSQEwkGAADMGZbl0DE047.jpg-wh_50

wKioL1l0X5uBp7VBAAA_d3mAxjc179.jpg-wh_50


 注:若是监控网卡进/出站流量,先建立一个关于net 的aplication 再建立item,选择 item 时key 值选择 net.if.in[eth0,bytes]接口


  4、 默认Item 有多种类型,进程

        zabbix-agent 工做模式有:passive,active
事件

        网卡流量相关:

            net.if.in [if,<mode>]  //if 接口,如eth0 ;mode :bytes,packets,errors,dropped

            net.if.out [if,<mode>]

            net.if.total [if,<mode>]

        监控端口相关:

            net.tcp.listen [port]  //监听了哪些端口

            net.tcp.port [ip,<port>]  //监听了某IP哪些端口

            net.tcp.service [service,<ip>,<port>]  //监听在哪一个IP的服务,哪一个端口

        进程相关:

            kernel.maxfiles  //进程容许打开的最大链接数

            kernel.maxproc   //kernel容许运行的最大进程数

        cpu相关:

            system.cpu.intr  //中断次数

            system.cpu.load [<cpu>,<mode>]  //cpu 的负载


    自定义item:

            关键:选取一个惟一的key:

            命令:收集数据的命令或脚本





    五、定义Triggers (能够存在依赖关系的组件)

    选择node2--Triggers--建立Triggers

    Trigger的状态通常就2种,要么OK ,要么Problem  超出定义的数值就显示Problem,即一个事件发生

    每次接受到一个item的新数据时都会对item的当前采样值进行判断(与triggers的表达式比较)

    一个triggers 只能属于一个item,一个item 能够有多个trigger

wKioL1l0avzzAulxAADF9RIvTWI112.jpg-wh_50


wKioL1l0axXxir5RAACG0QgAeH8922.jpg-wh_50

 

  六、 定义Graph( 选择node2--Graph--建立Graph)

wKiom1l0aHnjV2FKAACeaMGEQX0377.jpg-wh_50


    七、定义Actions

      (1)触发条件通常为事件:

        Trigger events: ok---problem

        Discovery events: zabbix的network discovery 工做时发现主机

        Auto registration events: 主动模式的agent注册时产生的事件

        Internal events :Item 变成再也不被支持或Trigger变成未知状态


wKioL1l0bpmjvAZYAACkpbcf-IM600.jpg-wh_50


    (2)operations 的功能:

        动做:send message 、Remote command

        配置send message:

            (1)定义media---(2)定义好用户---(3)配置要发送的消息---(4)报警升级

             因此咱们要定义一个操做时,事先要定义好media、用户等

        


wKiom1l0ltChlmJmAADKDhwYqUE510.jpg-wh_50


wKioL1l0luLwVDMpAABuPkFVgfA940.jpg-wh_50

wKiom1l0lvHB7QdqAADXseBEfM8544.jpg-wh_50

   

    八、定义media types      wKiom1l0mKSQzumsAACmfrJfbPg829.jpg-wh_50


    九、定义用户有三个选项,

      (1)用户-----》

    wKiom1l0mjKgC5RSAACKB2gP5N0266.jpg-wh_50



















    (2)报警媒介------》

wKiom1l0mw6AALEZAACaHYJ9lso120.jpg-wh_50

    (3)权限------!

wKiom1l0nBTQFg6YAAC2SOqhJmw860.jpg-wh_50



    十一、定义好用户、报警媒介、权限后回头再来action的条件、操做等

wKiom1l0nYCjPFxQAACaTHZs7m8580.jpg-wh_50


这样就定制了一个完整的监控报警机制,一旦触发一个事件,就会以定义的媒介通知定义的管理员。

相关文章
相关标签/搜索