系统负载命令观察


1  CPU负载  # cat /proc/loadavg 检查前三个输出值是否超过了系统逻辑CPU的4倍。  逻辑CPU的个数能够经过如下命令得到: # cat /proc/cpuinfo | grep “^processor” | wc -l 另外,也能够用命令uptime取得CPU负载信息 2  CPU负载  #mpstat 1 1 检查%idle是否太低(好比小于5%) 3  内存空间  # free 检查free值是否太低  也能够用 # cat /proc/meminfo 4  swap空间  # free 检查swap used值是否太高  若是swap used值太高,进一步检查swap动做是否频繁: # vmstat 1 5 观察si和so值是否较大 5  磁盘空间  # df -h 检查是否有分区使用率(Use%)太高(好比超过90%)  如发现某个分区空间接近用尽,能够进入该分区的挂载点,用如下命令找出占用空间最多的文件或目录: # du -cks * | sort -rn | head -n 10 6  磁盘I/O负载  # iostat -x 1 2 检查I/O使用率(%util)是否超过100% 7  网络负载  # sar -n DEV 检查网络流量(rxbyt/s, txbyt/s)是否太高 8  网络错误  # netstat -i 检查是否有网络错误(drop fifo colls carrier)  也能够用命令:# cat /proc/net/dev 9  网络链接数目  # netstat -an | grep -E “^(tcp)” | cut -c 68- | sort | uniq -c | sort -n 10  进程总数  # ps aux | wc -l 检查进程个数是否正常 (好比超过250) 11  可运行进程数目  # vmwtat 1 5 r列给出的是可运行进程的数目,检查其是否超过系统逻辑CPU的4倍 12  线程数目 13  进程  # top -id 1 观察是否有异常进程出现 14  网络状态  检查DNS, 网关等是否能够正常连通 15  用户  # who | wc -l 检查登陆用户是否过多 (好比超过50个)  也能够用命令:# uptime 16  系统日志  # cat /var/log/rflogview/*errors 检查是否有异常错误记录  也能够搜寻一些异常关键字,例如: # grep -i error /var/log/messages # grep -i fail /var/log/messages 17  核心日志  # dmesg 检查是否有异常错误记录 18  系统时间  # date 检查系统时间是否正确 19  打开文件数目  # lsof | wc -l 检查打开文件总数是否过多 20  日志  # logwatch –print  配置/etc/log.d/logwatch.conf,将 Mailto 设置为本身的email 地址,启动mail服务 (sendmail或者postfix),这样就能够天天收到日志报告了。 缺省logwatch只报告昨天的日志,能够用# logwatch –print –range all 得到全部的日志分析结果。 能够用# logwatch –print –detail high 得到更具体的日志分析结果(而不单单是出错日志)。
相关文章
相关标签/搜索