Zabbix完整的监控流程node
前面学习了zabbix的工做原理和安装方法,今天咱们学习zabbix 添加监控主机:tcp
一、添加一台主机( 配置--主机--添加主机)ide
这样 node2 就被添加上来了。学习
二、添加node2 的应用集(aplication)spa
选择node2 应用集--建立应用集--名称为cpu stats (再建立一个memory stats)
3d
三、添加item (选择node2 item--建立item)blog
注:若是监控网卡进/出站流量,先建立一个关于net 的aplication 再建立item,选择 item 时key 值选择 net.if.in[eth0,bytes]接口
4、 默认Item 有多种类型,进程
zabbix-agent 工做模式有:passive,active
事件
网卡流量相关:
net.if.in [if,<mode>] //if 接口,如eth0 ;mode :bytes,packets,errors,dropped
net.if.out [if,<mode>]
net.if.total [if,<mode>]
监控端口相关:
net.tcp.listen [port] //监听了哪些端口
net.tcp.port [ip,<port>] //监听了某IP哪些端口
net.tcp.service [service,<ip>,<port>] //监听在哪一个IP的服务,哪一个端口
进程相关:
kernel.maxfiles //进程容许打开的最大链接数
kernel.maxproc //kernel容许运行的最大进程数
cpu相关:
system.cpu.intr //中断次数
system.cpu.load [<cpu>,<mode>] //cpu 的负载
自定义item:
关键:选取一个惟一的key:
命令:收集数据的命令或脚本
五、定义Triggers (能够存在依赖关系的组件)
选择node2--Triggers--建立Triggers
Trigger的状态通常就2种,要么OK ,要么Problem 超出定义的数值就显示Problem,即一个事件发生
每次接受到一个item的新数据时都会对item的当前采样值进行判断(与triggers的表达式比较)
一个triggers 只能属于一个item,一个item 能够有多个trigger
六、 定义Graph( 选择node2--Graph--建立Graph)
七、定义Actions
(1)触发条件通常为事件:
Trigger events: ok---problem
Discovery events: zabbix的network discovery 工做时发现主机
Auto registration events: 主动模式的agent注册时产生的事件
Internal events :Item 变成再也不被支持或Trigger变成未知状态
(2)operations 的功能:
动做:send message 、Remote command
配置send message:
(1)定义media---(2)定义好用户---(3)配置要发送的消息---(4)报警升级
因此咱们要定义一个操做时,事先要定义好media、用户等
八、定义media types
九、定义用户有三个选项,
(1)用户-----》
(2)报警媒介------》
(3)权限------!
十一、定义好用户、报警媒介、权限后回头再来action的条件、操做等
这样就定制了一个完整的监控报警机制,一旦触发一个事件,就会以定义的媒介通知定义的管理员。