由于公司会有人时不时去拉取备份日志或者包等,zabbix和阿里云都会出现流量告警,但具体是哪一个用户或者哪一个进程使用的流量,不知道,告警出现后,登陆服务器查看,流量已经下来了,查看起来比较繁琐,因此直接弄一个进程流量告警,超过阀值,把进程号,用户,进出流量大小都输出出来python
NetHogs是一款开源、免费的,终端下的网络流量监控工具,它可监控Linux的进程或应用程序的网络流量。NetHogs只能实时监控进程的网络带宽占用状况。NetHogs支持IPv4和IPv6协议,支持本地网卡以及PPP连接。shell
1.安装nethogs
我是 centos6,安装epel源使用一下版本
rpm -Uvh https://dl.fedoraproject.org/pub/epel/epel-release-latest-6.noarch.rpm
centos7的话,使用
rpm -Uvh https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpmcentos
2.使用nethogs
NetHogs提供交互式控制指令:
m : Cycle between display modes (kb/s, kb, b, mb) 切换网速显示单位
r : Sort by received. 按接收流量排序
s : Sort by sent. 按发送流量排序
q : Quit and return to the shell prompt. 退出NetHogs命令工具数组
NetHogs 命令行参数
经常使用的参数:
-d delay for refresh rate. 数据刷新时间 如nethogs -d 1 就是每秒刷新一次
-h display available commands usage. 显示命名帮助、使用信息
-p sniff in promiscious mode (not recommended).
-t (追踪模式)在控制台定时刷新各进程的收发带宽,使用管道命令>便可实现输出重定向
-V prints Version info.
-c 刷5次结束bash
#关键命令,使用如下命令进行重定向
nethogs -c 5 -d 2 -t
这里-c刷5次,是由于,前面一次会逐渐把有流量的进程打印出来,但前面几回的时候,会获取不到所有,全部我打印了5次,时间间隔2秒,差很少能把全部进程流量打印出来了,若还以为少了,能够增大时间服务器
#编写一下两个脚原本实现
#第一个: 这个脚本,实现执行两次,时间间隔是20秒,执行命令有10秒(输出5次,每次2秒),则输出两次恰好1分钟,而后加入计划任务,1分钟执行一次这个脚本,固然,这里的频率,能够自行调整网络
!/bin/bash count=0 while [ $count -lt 2 ] do count=$(($count+1)) /usr/sbin/nethogs -t -d 2 -c 5 > /tmp/flow_nethogs.tmp if [[ $count == 2 ]];then exit else sleep 20 fi done
#第二个:使用zabbix来读取这个日志文件,每分钟执行两次,或者更多,判断最后一次(也就是第5次,获取最完整的一次) 流量大小来进行输出ide
#!/usr/bin/python #coding=utf-8 #读取 nethogs.logs日志,获取流量过大的进程 #日志路径 log_path="/tmp/flow_nethogs.tmp" file = open(log_path,"r") message = file.read() file.close() #设置流量阀值大小,大于阀值则输出内容 max_flow = 2048 #以Refreshing: 为分隔符,获得数组 mes_sp = message.split("Refreshing:") #获得数组的最后一个元素,去掉空行 resu_str = mes_sp[len(mes_sp) - 1].strip("\n") #以换行符分割数据 resu_li = resu_str.split("\n") for proc in resu_li: proc_li = proc.split("\t") if len(proc_li) == 3: proc_name = proc_li[0] proc_send = proc_li[1] proc_rec = proc_li[2] if float(proc_send) > max_flow or float(proc_rec) > max_flow: print "进程:" + proc_name + ", 发送: " + proc_send + " KB/sec, " + "接收: " + proc_rec + " KB/sec"
超过阀值,则输出进程信息,没有超出,则不会输出任何数据,因此在zabbix里面,告警设置成 值不为空,则告警工具
备注:nethogs针对服务器业务进程较少的一种 不会占用多少资源,若过多,会占用资源,能够先根据本身的环境来测测看,nethogs方法比较简单,能够直接获取进程信息等,还有一个工具是iftop,这个工具就没这么耗费资源了,但进程信息等,须要本身写命令查找,后面继续更新iftop结合zabbix来监控!!!o( ̄︶ ̄)oui