一、告警系统邮件引擎:python
由于以前作zabbix的时候,用过mail.py,这里直接调用就能够了:vim
可是告警邮件引擎核心,conf主配置文件调用到的都是mail.sh,因此这里须要定义调用mail.py的sh脚本:bash
mail.sh的目录是作告警收敛目的就是1分钟前发现问题,而后到10分钟后,服务尚未恢复,就会告诉管理人员10分钟了服务还未恢复:,若是不作告警收敛,在发现问题的时候直接告警就好,可是,可能会发生1分钟前发现问题,1分钟户问题解决,这样就会变成误报,这样会很麻烦:测试
1:首先须要在/usr/local/bin/mail/定义两个文件: mail.py mail.shdebug
mail.py的内容:日志
[root@localhost_01 mail]# cat mail.py #!/usr/bin/env python #-*- coding: UTF-8 -*- import os,sys reload(sys) sys.setdefaultencoding('utf8') import getopt import smtplib from email.MIMEText import MIMEText from email.MIMEMultipart import MIMEMultipart from subprocess import * def sendqqmail(username,password,mailfrom,mailto,subject,content): gserver = 'smtp.163.com' gport = 25 try: # msg = MIMEText(unicode(content).encode('utf-8')) //若是发送的邮件有乱码,能够尝试把这行改为以下: msg = MIMEText(content,'plan','utf-8') msg['from'] = mailfrom msg['to'] = mailto msg['Reply-To'] = mailfrom msg['Subject'] = subject smtp = smtplib.SMTP(gserver, gport) smtp.set_debuglevel(0) smtp.ehlo() smtp.login(username,password) smtp.sendmail(mailfrom, mailto, msg.as_string()) smtp.close() except Exception,err: print "Send mail failed. Error: %s" % err def main(): to=sys.argv[1] subject=sys.argv[2] content=sys.argv[3] sendqqmail('yzhm188@163.com','受权码','yzhm188@163.com',to,subject,content) if __name__ == "__main__": main()
mai.sh的内容以下:code
[root@localhost_01 mail]# vim mail.sh #!/bin/bash log=$1 t_s=`date +%s` t_s2=`date -d "2 hours ago" +%s` //定义2个小时的时间戳 #日志不存在就建立日志 if [ ! -f /tmp/$log ] then echo $t_s2 > /tmp/$log fi #下面这段,等同于一个计时器 t_s2=`tail -1 /tmp/$log|awk '{print $1}'` echo $t_s>>/tmp/$log v=$[$t_s-$t_s2] //时间戳对比 echo $v #当故障存在3600秒,就会进行告警 if [ $v -gt 3600 ] then ../mail/mail.py "$1" "$2" "$3" echo "0" > /tmp/$log.txt //等同于计数器 else if [ ! -f /tmp/$log.txt ] then echo "0" > /tmp/$log.txt fi nu=`cat /tmp/$log.txt` nu2=$[$nu+1] echo $nu2>/tmp/$log.txt if [ $nu2 -gt 10 ] then ../mail/mail.py $1 "trouble continue 10 min $2" "$3" echo "0" > /tmp/$log.txt //邮件告警结束之后,从新开始计数 fi fi
注释:脚本运用于间隔3600秒(1小时)后则再次报次故障信息,经过时间上一次和这一次的时间戳来判断:server
注释:核心判断:经过计时器、计数:blog
二、运行告警系统:crontab
执行告警系统,确定要是每分钟,执行一次:
[root@localhost_01 mail]# crontab -e [root@localhost_01 mail]# cat /var/spool/cron/root * * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh You have mail in /var/spool/mail/root
注释:监控发送邮件的部分,尽可能少用空格,由于mail.py发送邮件是以 空格来定义三个参数的:
测试:咱们以测试系统负载为例,修改load.sh的负载脚本,当为0时则告警,而后运行sh /usr/local/sbin/mon/bin/main.sh,而后查看邮箱,有邮件过来:
注释:mail.py也一次定义多个发件人:以下:
https://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001386832745198026a685614e7462fb57dbf733cc9f3ad000