真实记录疑似Linux病毒致使服务器带宽跑满的解决过程

时间 2019-11-08

标签真实记录疑似 linux 病毒致使服务器带宽满的解决过程栏目 Linux 繁體版

原文原文链接

案例描述linux

　　因为最近我在重构以前的APP，须要和server端进行数据交互，发现有一个现象，那么就是隔1~2天总会发生获取数据超时的问题，并且必需要重启服务器才能解决。早在以前，我有留意到这个问题，可是因为这个服务器目前只有我测试的时候才有访问，其余的途径的数据交互几乎没有，可是此次必需要把这个问题解决了，由于APP我确定要上线的。nginx

按理分析浏览器

　　服务器是基于阿里云的 Linux-CentOs 6.5，由nginx解析，首先登录阿里云官网去查看ECS云服务器的运行状况，显示的是运行中，和以往同样，费用没到期，而后在浏览器中打开官网，同样是访问不了，当时第一个想法就是带宽过载，为何不是代码问题呢？由于不能访问是周期性的问题，确定不是代码问题。为了确认想法，去阿里云发了次工单，请求下阿里的技术人员的帮助。服务器

　　阿里的大牛回复和我所想的同样，这时候就是进终端进一步解决了。我通常使用 XShell 软件来管理linux服务器终端的，因为外部都没法访问，那么XShell也就没法远程了，的确如此，带宽跑满，哪怕是远程终端都是不可能的。这时候由从官网进入终端。
工具

　　登录后，先用命令 sar -n DEV 1 1 查看下网卡流量的数据包和比特流等状况，1 秒取一次值，发现是震惊的。测试

　　首先eth0 是内网卡，eth1是外网， rxpck 这个是接收的数据包，txpck 是发出的数据包，rxkB 是接收的字节， txkB 是发出的字节。发现公网在大量向外发数据包，且我上面说到，这个服务器目前只有我测试APP才有请求过来，再怎么发也不会达到19万多/s，还有这个数据会变的，有时候达到 20 万。是否是感受有点 DDOS 的感受，不过，rxpck 接收的并很少，这是DDOS 的概率有点低，初步怀疑是有恶意程序在大量发包。阿里云

　　为了看看 eth1 到底发了多少，输入 ifconfig 回车，我擦，2点多 T 啊。spa

　　为了弄清楚是目前运行的线程有哪些，我打算采用了 nethogs 这个工具，它能够监控进程实时的流量，可悲剧的是，在这以前没安装它，而后就打算当场安装，然而，当我采用 yum install nethogs 安装的时候，发现一直处于超时(time out)的状况，ping 了下百度，发现延时很高。果真，确定受当前的状况影响。线程

　　既然查不了线程的实时流量，只能查看当前的进程了，输入 ps -ef ，看到有一个名为 vcers 的程序占用 CPU 利用率高达 34% +
3d

　　ls 一下，在 root 目录，再 find -name “vcers” ，发现只有这么一个

解决问题

　　猜测，多是它在大量发包，因而直接 kill -TERM PID号杀掉了 vcers 的进程，再 sar -n DEV 1 1 看下，恢复正常

　　刷新下APP，有数据了，再打开下官网连接，正常访问。赶忙下载了 nethogs 以防万一，最后再打印下进程信息，确认 vcers 没再运行，下次再出现的话，若还过载，就完全删除 vcers 的可运行程序。

真实记录疑似Linux病毒致使服务器 带宽跑满的解决过程

真实记录疑似Linux病毒致使服务器带宽跑满的解决过程