添加自定义监控项目

添加自定义监控项目python

  • 需求:监控某台web的80端口链接数,并出图
  • 两步:1)zabbix监控中心建立监控项目;2)针对该监控项目以图形展示
  • 对于第一步,须要到客户端定义脚本
  • vim /usr/local/sbin/estab.sh //内容以下
#!/bin/bash
##获取80端口并发链接数
netstat -ant |grep ':80 ' |grep -c ESTABLISHED
  • chmod 755 /usr/local/sbin/estab.sh
  • 客户端上编辑配置文件 vim /etc/zabbix/zabbix_agentd.conf//增长
UnsafeUserParameters=1  //表示使用自定义脚本
UserParameter=my.estab.count[*],/usr/local/sbin/estab.sh 
//自定义监控项的key为my.estab.count,后面的[*]里面写脚本的参数,若是没有参数则能够省略,脚本为/usr/local/sbin/estab.sh
  • 重启zabbix-agent服务 systemctl restart zabbix-agent
  • 首先到服务端验证,执行命令
  • zabbix_get -s 192.168.180.135 -p 10050 -k 'my.estab.count‘
  • 而后在zabbix监控中心(浏览器)配置增长监控项目
  • 键值写my.estab.count
  • 添加该项目后,到“监测中” “最新数据”查看刚添加的项目是否有数据出现
  • 有了数据就能够添加图形了
  • “配置”“主机” “图形” “建立图形”

添加自定义监控项目配置

  • zabbix的监控项目是在模板里面体现,可是有时候就会有些个性化的需求:某一个业务的数据,好比:运营人员想知道网站会员注册量,会员活跃度;实际上,这些数据,均可以经过数据库里面的表的数字来体现,可是zabbix模板是不可能提供那么详细的监控项目;遇到这种状况,就须要经过编程工具,写成脚本,把数字展示出来,而后经过zabbix监控项目,造成图表,就能够实现分析天天的数据是多少;
  • 需求 
    • 监控某台web的80端口链接数,并出图
  • 解决方法: 
    • 1)zabbix监控中心建立监控项目;
    • 2)针对该监控项目以图形展示;
  • 首先须要在客户端(B机器)定义脚本
[root@yong-02 ~]# vim /usr/local/sbin/estab.sh

#!/bin/bash
##获取80端口并发链接数
netstat -ant |grep ':80 ' |grep -c ESTABLISHED
  • 更改一个可以让zabbix用户执行的权限  chmod 755 /usr/local/sbin/estab.sh
B机器
[root@yong-02 ~]# chmod 755 /usr/local/sbin/estab.sh 
[root@yong-02 ~]# ll /usr/local/sbin/estab.sh 
-rwxr-xr-x 1 root root 91 7月  10 22:43 /usr/local/sbin/estab.sh
  • 在客户端上编辑zabbix配置文件
B机器
[root@yong-02 ~]# vim /etc/zabbix/zabbix_agentd.conf 

搜索 /UnsafeUserParameters

将# UnsafeUserParameters=0
改成UnsafeUserParameters=1  
#目的是使用自定义脚本

搜索 /UserParameter
将# UserParameter=
改成UserParameter=my.estab.count[*],/usr/local/sbin/estab.sh 
#表示自定义监控项的key为my.estab.count,后面的[*]里面写脚本的参数,若是没有参数则能够省略,若是有参数写入到 [ ] 里面,用逗号分隔,脚本为/usr/local/sbin/estab.sh
  • my.estab.count 这个是zabbix监控项里的 键值
  • 客户端(B机器),重启 zabbix-agent 服务
B机器
[root@yong-02 ~]# systemctl restart zabbix-agent.service
  1. 检查自定义的脚本是否被识别
  2. 到服务端(A机器)验证,执行命令,server没法获取数据
  • zabbix_get -s 192.168.180.135 -p 10050 -k 'my.estab.count' 
    • -s 指定客户端的IP地址
    • -p 指定端口,不加-p,默认就是10050端口
    • -k 表示 键值
A机器
[root@yong-01 ~]# zabbix_get -s 192.168.180.135 -p 10050 -k 'my.estab.count'
0
  • 如果以前在客户端(B机器)写的脚本权限不设置成 755 ,这里的server获取数据时,就会提示 权限不够
  1. 在获取数据的时候,必定要保证数据的一般,防火墙和selinux都须要去设置,不然就会有可能没法获取数据
  2. 在zabbix监控中心(浏览器)配置增长监控项目,在 配置 ——> 主机 ——>建立监控项
  • 名称 写为:并发连接数
  • 类型 :选择zabbix客户端
  • 键值 写:my.estab.count——>键值可自定义,是不固定的
  • 单位 :保持默认
  • 历史数据保留时长(单位天):默认保持90天
  • 应用集:能够不选择,由于没有定义应用集

  • 在添加该项目后,还须要添加图形,配置——>主机——>图形——>建立图形

  • 名称为建立并发连接数——>而后添加监控项 并发连接数——>点击添加

 

  • 在图形中,查看新建立的图形,而后选择预览
  • 如果网站访问量很大,那么每隔30秒就能够看到一个数字,时间长了,就可查看到网站访问量的趋势

  • 作一个触发器,选择触发器——>建立触发器
  • 当并发大于200,作警告级别

 

  • 这样触发器就配置成功

总结:

  • 在服务端上获取数值(经过脚本实现),给予服务端访问脚本的权限,在zabbix监控中心添加对应的监控项目(输入键值),便可

配置邮件告警

  • 使用163或者QQ邮箱发告警邮件
  • 首先登陆你的163邮箱,设置开启POP三、IMAP、SMTP服务
  • 开启并记录受权码
  • 而后到监控中心设置邮件告警
  • “管理”,“报警媒介类型”,“建立媒体类型”
  • {ALERT.SENDTO} ,{ALERT.SUBJECT},{ALERT.MESSAGE}

输入图片说明

  • 建立报警脚本mail.py
  • vim /usr/lib/zabbix/alertscripts/mail.py//内容参考
  • chmod 755 /usr/lib/zabbix/alertscripts/mail.py
  • 建立一个接受告警邮件的用户,“管理”,“用户”,“建立用户”,“报警媒介”,类型选择“baojing”,注意用户的权限,若是没有须要到用户组去设置权限
  • 设置动做,“配置”,“动做”,“建立动做”,名称写“sendmail”(自定义),“操做”页面,内容以下
HOST:{HOST.NAME} {HOST.IP}
TIME:{EVENT.DATE}  {EVENT.TIME} 
LEVEL:{TRIGGER.SEVERITY} 
NAME:{TRIGGER.NAME}
messages:{ITEM.NAME}:{ITEM.VALUE}
ID:{EVENT.ID}
  • “新的触发条件”,A维护状态 非在 维护,B触发器示警度>=未分类
  • “操做”,选择发送的用户为刚建立的用户,仅送到选择“baojing”
  • 切换到“恢复操做”,把信息改为以下
HOST:{HOST.NAME} {HOST.IP}
TIME:{EVENT.DATE}  {EVENT.TIME} 
LEVEL:{TRIGGER.SEVERITY} 
NAME:{TRIGGER.NAME}
messages:{ITEM.NAME}:{ITEM.VALUE}
ID:{EVENT.ID}
  • 点击“新的”,“操做”,选择发送的用户为刚建立的用户,仅送到选择“baojing”
  • 测试告警

配置邮件告警

  • 首先须要一个邮箱,使用邮箱发邮件(163邮箱)
  • 访问163邮箱,在第三方平台上调用163邮箱发邮件,须要设置开启POP三、IMAP、SMTP服务
  • 设置——POP3/IMAP/SMTP 
    • 第一次开启POP3/IMAP/SMTP服务会有短信验证
    • 在验证完以后还须要设置客户端受权密码(须要牢记),接下来发邮件的密码就是受权密码
  • 在写脚本以前 进入zabbix的web界面——> 管理——> 报警媒介类型——>建立媒体类型
  • 在报警媒介类型里面的自带的 Email 使用不方便,因此本身写python发邮件的脚本

 

  • 名称:指的是报警媒介类型的名称,自定义,这里叫作报警
  • 类型:脚本
  • 脚本名称:自定义,这里叫作mail.py
  • 在py脚本参数下,三个参数都分布在py的脚本里 
    • {ALERT.SENDTO} 表示收件人
    • {ALERT.SUBJECT} 表示邮件主题
    • {ALERT.MESSAGE} 表示邮件内容
  • 这时会看到成功添加“报警"报警媒介类型

 

  1. 要实现报警,首先py脚本能发出邮件
  2. 在服务端(A机器)建立报警脚本mail.py,查看报警脚本所在位置
A机器
[root@yong-01 ~]# vim /etc/zabbix/zabbix_server.conf 

搜索 /alert
AlertScriptsPath=/usr/lib/zabbix/alertscripts
#报警脚本所在路径
  • 建立报警脚本mail.py,在/usr/lib/zabbix/alertscripts/目录下是空的, 来建立,脚本内容参考
A机器
[root@yong-01 ~]# cd /usr/lib/zabbix/alertscripts/
[root@yong-01 alertscripts]# vim mail.py

#!/usr/bin/env python
#-*- coding: UTF-8 -*-
import os,sys
reload(sys)
sys.setdefaultencoding('utf8')
import getopt
import smtplib
from email.MIMEText import MIMEText
from email.MIMEMultipart import MIMEMultipart
from  subprocess import *
def sendqqmail(username,password,mailfrom,mailto,subject,content):
    gserver = 'smtp.163.com'
##定义发邮件类型
    gport = 25
    try:
        msg = MIMEText(unicode(content).encode('utf-8'))
        msg['from'] = mailfrom
        msg['to'] = mailto
        msg['Reply-To'] = mailfrom
        msg['Subject'] = subject
        smtp = smtplib.SMTP(gserver, gport)
        smtp.set_debuglevel(0)
        smtp.ehlo()
        smtp.login(username,password)
        smtp.sendmail(mailfrom, mailto, msg.as_string())
        smtp.close()
    except Exception,err:
        print "Send mail failed. Error: %s" % err
def main():
    to=sys.argv[1]
    subject=sys.argv[2]
    content=sys.argv[3]
##定义QQ邮箱的帐号和密码,你须要修改为你本身的帐号和密码(请不要把真实的用户名和密码放到网上公开,不然你会死的很惨)
    sendqqmail('163邮箱','密码','163邮箱',to,subject,content)

if __name__ == "__main__":
    main()
    
    
#####脚本使用说明######
#1. 首先定义好脚本中的邮箱帐号和密码
#2. 脚本执行命令为:python mail.py 目标邮箱 "邮件主题" "邮件内容"
  • 更改mail.py脚本的权限(很重要!!!),不然就会没法告警
  • chmod 755 /usr/lib/zabbix/alertscripts/mail.py
[root@yong-01 alertscripts]# chmod 755 mail.py 
[root@yong-01 alertscripts]# ll mail.py 
-rwxr-xr-x 1 root root 1390 7月  10 23:33 mail.py
[root@yong-01 alertscripts]# python mail.py yyli2008@163.com "adfsf" "ceshi"
  • 没有任何提示就表示发邮件成功
  • 这时打开163邮箱,会看到邮件

  • 如果在邮件里面写中文,到邮箱里面会显示乱码,这是由于在zabbix使用的是utf-8的字符集,而在邮箱里使用的是GBK字符集,因此会乱码
[root@yong-01 alertscripts]# python mail.py yyli2008@163.com "测试邮件" "测试邮件"

  • 建立一个接受告警邮件的用户(用户是用来接收邮件的),在建立用户的前提是建立一个用户组,用户组可使用已经存在的, 因此这里直接建立用户,管理-->用户-->建立用户

  • 再给刚刚的用户设置邮箱,管理-->用户-->报警媒介-->添加

  1. 还要 注意用户的权限,若是没有权限,邮件是无法发的,要暂时到用户组里 (管理-->用户群组)
  • 默认的权限是无,须要去修改群组,给予权限

输入图片说明

输入图片说明

  • 设置动做,咱们配置了触发器,那么触发后应该去作什么,配置-->动做-->建立动做
  • 动做 
    • 名称:中英文均可以,这里叫 发邮件
    • 条件:维护状态 非在 维护,就表示 维护状态机器不进行发邮件 
      • 新的触发条件,当触发器示警度(也就是信息,警告,通常严重...)大于等于未分类(未分类 表示 全部状态,都会发信息)

输入图片说明

  • 配置-->动做-->操做 
    • 默认信息:直接删除原有的(比较乱),粘贴下面的内容
    • 维护期间暂停操做:选择打勾(若不打对勾也能够,由于在动做的条件里定义了)
默认信息定义当发生报警时,zabbix会向你的邮箱发送什么内容
HOST:{HOST.NAME} {HOST.IP}              (定义主机名)
TIME:{EVENT.DATE}  {EVENT.TIME}          (定义事件发生时间)
LEVEL:{TRIGGER.SEVERITY}                (定义示警度)
NAME:{TRIGGER.NAME}                   (定义哪个触发器发出的报警)
messages:{ITEM.NAME}:{ITEM.VALUE}           (发出告警会出现什么状态码)
ID:{EVENT.ID}                         (发生事件的id)

  • 配置-->动做-->恢复操做 
    • 默认信息:直接删除原有的(比较乱),粘贴下面的内容(粘贴内容和操做里面复制进去的信息是相同的)
HOST:{HOST.NAME} {HOST.IP}
TIME:{EVENT.DATE}  {EVENT.TIME} 
LEVEL:{TRIGGER.SEVERITY} 
NAME:{TRIGGER.NAME}
messages:{ITEM.NAME}:{ITEM.VALUE}
ID:{EVENT.ID}

 

  • 最后点 添加 确认

测试告警

  • 建立触发器,来实现告警,配置-->主机-->yong-02主机-->建立触发器
  • 名称:系统负载
  • 严重性:警告
  • 表达式: 以下

  • 选择 添加

  • 最终看到以下

  • 而后回到监控中心,主页——>最近20个问题
  • 若是提示为启用中,证实发现问题,正在启用告警,显示问完成,就证实已经发送邮件告警;如图,咱们的实验是成功的

  • 查看邮箱,会看到邮件发送
  1. 这就表示测试邮件告警成功
  2. 这时想要解决这个问题,只要将触发器 系统负载条件数值调整 >1 便可,再来查看监控中心,就会发现问题消失了,而且会给邮箱发送 OK 的邮件
  • 19.16 不发邮件的问题处理

不发邮件的问题处理

  • 由于虚拟机,可能存在一些bug,第一次配置的时候,常常会出现zabbix发现问题,作了邮件告警,可是邮箱却没有收到邮件的问题;
  • 从新恢复快照之后再作一次,就又能正常发送邮件,接收邮件了

配置邮件告警总结

  1. 到 163邮箱或 QQ邮箱 开启SMTP服务,并记录受权码,没有开启,脚本里面就没法去写密码
  2. 设置邮件告警
  • 首先设置一个报警媒介; 
    • 三个参数必须填写正确,顺序也不能错误
  1. 编辑邮件告警脚本,脚本地址
  • /usr/lib/zabbix/alertscripts目录下
  • 路径不能错误,必须在这个路径下,添加一个脚本
  1. 建立好以后,记得给脚本755权限,不然zabbix用户是没法调用这个脚本的
  2. 配置用户
  • 配置用户以前,把用户群组的权限改一下,让组有一个读写权限
  • 用户加到指定的群组里
  • 报警媒介,添加本身的邮箱地址,本身给本身发,这个成功率会比较高
  1. 配置动做
  • 操做修改默认信息(发送邮件的格式),操做须要添加一个“新的”给谁发邮件;恢复操做一样
  1. 测试一下告警是否能成功发送邮件
  • 人为建立一个触发器,设置一个系统最低运行都会触发报警的触发器
  • 也能够在客户端上断开链接(中止客户端的zabbix服务)
  1. 更改主动和被动
  • PS: 客户端主动模式和被动模式,在监控项里,选择一个监控项打开,选择类型是客户端主动,客户端;客户端主动即为主动模式,客户端为被动模式
  1. 触发器不能用中文命名,否则邮件显示乱码
相关文章
相关标签/搜索