1 CPU负载 # cat /proc/loadavg 检查前三个输出值是否超过了系统逻辑CPU的4倍。 逻辑CPU的个数能够经过如下命令得到: # cat /proc/cpuinfo | grep “^processor” | wc -l 另外,也能够用命令uptime取得CPU负载信息 2 CPU负载 #mpstat 1 1 检查%idle是否太低(好比小于5%) 3 内存空间 # free 检查free值是否太低 也能够用 # cat /proc/meminfo 4 swap空间 # free 检查swap used值是否太高 若是swap used值太高,进一步检查swap动做是否频繁: # vmstat 1 5 观察si和so值是否较大 5 磁盘空间 # df -h 检查是否有分区使用率(Use%)太高(好比超过90%) 如发现某个分区空间接近用尽,能够进入该分区的挂载点,用如下命令找出占用空间最多的文件或目录: # du -cks * | sort -rn | head -n 10 6 磁盘I/O负载 # iostat -x 1 2 检查I/O使用率(%util)是否超过100% 7 网络负载 # sar -n DEV 检查网络流量(rxbyt/s, txbyt/s)是否太高 8 网络错误 # netstat -i 检查是否有网络错误(drop fifo colls carrier) 也能够用命令:# cat /proc/net/dev 9 网络链接数目 # netstat -an | grep -E “^(tcp)” | cut -c 68- | sort | uniq -c | sort -n 10 进程总数 # ps aux | wc -l 检查进程个数是否正常 (好比超过250) 11 可运行进程数目 # vmwtat 1 5 r列给出的是可运行进程的数目,检查其是否超过系统逻辑CPU的4倍 12 线程数目 13 进程 # top -id 1 观察是否有异常进程出现 14 网络状态 检查DNS, 网关等是否能够正常连通 15 用户 # who | wc -l 检查登陆用户是否过多 (好比超过50个) 也能够用命令:# uptime 16 系统日志 # cat /var/log/rflogview/*errors 检查是否有异常错误记录 也能够搜寻一些异常关键字,例如: # grep -i error /var/log/messages # grep -i fail /var/log/messages 17 核心日志 # dmesg 检查是否有异常错误记录 18 系统时间 # date 检查系统时间是否正确 19 打开文件数目 # lsof | wc -l 检查打开文件总数是否过多 20 日志 # logwatch –print 配置/etc/log.d/logwatch.conf,将 Mailto 设置为本身的email 地址,启动mail服务 (sendmail或者postfix),这样就能够天天收到日志报告了。 缺省logwatch只报告昨天的日志,能够用# logwatch –print –range all 得到全部的日志分析结果。 能够用# logwatch –print –detail high 得到更具体的日志分析结果(而不单单是出错日志)。