使用w查看系统负载、vmstat、top、sar、nload命令

时间 2019-12-18

标签使用查看系统负载 vmstat sar nload 命令栏目负载均衡繁體版

原文原文链接

监控系统状态

• w/uptime 查看系统负载
• cat /proc/cpuinfo 查看cpu核数数据库

• vmstat 监控系统状态
• 用法 vmstat 1
• 关键的几列：r，b，swpd，si，so，bi，bo，us，wabash

• top查看进程使用资源状况
• top -c 显示详细的进程信息
• top -bn1 静态显示全部进程
• q退出，数字1显示全部核cpu，大写字母M按内存使用排序
• 大写字母P按cpu使用排序服务器

load average 平均负载

三个查询平均负载的命令：w uptime top

w：查看当前系统的负载

[root@yong-02 ~]# w
 17:23:57 up 18 min,  2 users,  load average: 0.14, 0.70, 1.05
USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
root     tty1                      17:23   13.00s  0.01s  0.01s -bash
root     pts/0    192.168.180.1    17:18    5.00s  0.03s  0.00s w

17:23:57 当前系统时间； up 18 min, 启动多长时间；2 users, 两个用户。一个是tty1-6，pts/0是经过远程登陆的。网络

查看的内容是 load average

第一个值：1分钟内系统的平均负载；1分钟内有多少个进程在使用咱们的cpu计算或者在等待排队。负载均衡
第二个值：5分钟内系统的平均负载；5分钟内有多少个进程在使用咱们的cpu计算或者在等待排队。工具
第三个值：15分钟内系统的平均负载；15分钟内有多少个进程在使用咱们的cpu计算或者在等待排队。优化
负载越高，cpu的压力越大；ui

cpu概念：cpu并非来多少进程，它均可以所有为你提供服务，由于cpu在摸个时刻内只能给一个进程或任务提供服务，其余进程先排队，按照优先级的顺序一个一个的轮流使用cpu进行运算。

load average这个值何时合适，何时偏大，偏小都是有依据的，这是根据cpu的核数来规定的。逻辑CPUspa

查看cpu核数的命令：cat /proc/cpuinfo

看processor : 0 有几段，cpu就是几核code
user：用户
TTY：在哪里登录
FROM：从哪里登录
LOGIN@：登录时间
IDLE：空闲时间
JCPU:当前终端上全部进程及子进程占用cpu的时间
PCPU：当前进程占用cpu的时间
WHAT：当前具体哪一个命令

何时负载均衡高呢？
当有进程排队的时候就说明cpu核数不够了。

vmstat工具：查看系统瓶颈

前面讲到系统的平均负载，若是负载太高，咱们要查看是什么缘由形成负载太高呢？

vmstat 不加任何数值，值显示一行
vmstat 1 平均1秒显示一次
vmstat 1 5 平均1秒显示一次，显示5次

proce

r ：表示有多少个任务处于run状态：跑的状态，好比只有一个cpu，有10个进程，这10个进程有1个进程在使用cpu，9个在排队，可是9个不是一直在排队，而是有一个值好比1个进程使用cpu1分钟，到了1分钟，第二进程使用cpu1分钟，以此类推，直到进程完成。
b ：进程被cpu之外的资源阻塞了，好比硬盘或者是带宽阻塞了。 block被阻塞的，何时被阻塞呢？好比磁盘很忙的时候，你去写一个数据，计算结果出来你要把结果写入磁盘里面去，可是磁盘很慢，它毕竟比不了cpu的速度，只能等待一会，这儿就是磁盘被阻塞了，这个任务被磁盘的IO阻塞了。再好比咱们的带宽跑满了，数据想经过TCP/IP通讯的方式传输出到远程去送给另一个服务器上，这个时候若是带宽跑满了，网速很忙，它也会被阻塞，总之：blocal就是那些被咱们IO阻塞的任务有多少个，不论是磁盘仍是网络。

memory

swap ：有多少个数据量在被交换（单位KB）：表示有多少数据量被拿到交换分区里面。这个数值不变化，说明你的内存没有问题，若是这个数值比较大而且频繁的变更，这个时候就要注意你的内存可能不够，或者是内存溢出（程序写的有问题）。
free ：内存还剩余多少，单位为KB。
buff：表示即将写入磁盘的缓冲大小，单位为KB。
cache：表示从磁盘中读取的缓冲大小，单位为KB。

swap 显示内容的交换状况

si ： swap in 进入内存。对象是内存
so ：swap out 从内存里面出来，对象是内存

这两个值一直为0或者很小，没有什么变化很稳定，说明内存够，没有瓶颈，若是这个值来回的变化很频繁，长期大于0.，说明你的内存不够

io显示磁盘的使用状况

bi ：进入到内存中去，这意味从磁盘里面读出来：读磁盘
bo ：从内存读出来，这意味着写入磁盘里面去：写磁盘

这两个值怎么叫大呢，通常的服务器超过1000，就有必定压力（一直是1000以上）就会产生瓶颈。若是只是偶尔1000，其余时候都是0或者很小，就说明问题不大

system显示采集间隔内发生的冲断次数

in 终端
cs 上下文切换

这个两个值在一秒钟的次数

cpu 显示cpu的使用状态

us ：用户进程占用cpu的时间百分比
sy ：内核进程占用cpu的时间百分比
id ： CPU空闲状态的时间百分比
wa ： I/O等待所占用cpu的时间百分比
st ：被偷走的的CPU所占百分比（通常都为0，不用关注）

r，b 值很高说明系统负载很高，查看cpu是否有瓶颈。
us 也很关键，若是us一直高于50或者接近100%说明某一个进程占用cpu很大的资源，肯那个就是一些计算量很大的任务须要优化一下。
日常咱们去衡量一个系统的负载不只要看一份中内的负载load average值，还要查看cpu的us这个值得百分比。

top 命令：查看具体进程

top 默认3秒一次
q 退出
top -d 1 1秒显示一次
top -c 显示具体进程的命令，更全路径
top -bn1 一次性静态显示出来；通常用在写在脚本里面。
top 通常查看load average ；us，sy ，物理内存剩余空间

total ：全部进程
sleepling ：休眠的进程
stopped：已经中止进程
zombie ：僵尸进程，主进程意外中断，只剩下一些子进程，自生自灭

默认状况下，按cpu使用百分比排序。

PID：进程id ；进程ID在/proc 下
USER: 用户名
PR：范围0~39；NI：范围-20~19；进程优先级，PR数值越小，优先级越高
VIRI：虚拟内存大小
RES：物理内存大小，使用了多少物理内存，单位kib
SHR：共享内存
S：进场状态
cpu：cpu使用多少百分比
mem：内存使用多少百分比

top 状态下按M 能够按内存使用大小排序
按P 按cpu排序
按数字1能够列出各颗cpu的状态

监控系统状态

•sar -n DEV 网卡流量若是没有sar 命令安装yum install -y sysstat
• sar -q 系统负载
• sar -b 磁盘读写
• sar -f /var/log/sa/saxx 历史文件
• nload命令
• yum install -y epel-release
• yum install -y nload

网卡何时有瓶颈千M网卡
带宽指的是比特bit
1byt（字节）=8bit
家庭用的10M带宽，理论上下载的速度是10M/8=1.25M/s
比特是网卡上的计量单位，就是所谓的数据流，而字节是计算机上文件的大小
1M=1024KB
1KB=1024byt
为了计算方便用1000来换算。
1M=1000KB
1KB=1000byt

sar -n DEV 查看网卡流量
sar -n DEV -f /var/log/sa/sa13 查看历史流量
sar -q 查看历史负载
sar -b 查看历史磁盘
sar -p 查看历史cpu

sar 命令很强大，它能够监控系统全部资源状态，好比平均负载、网卡流量、磁盘状态、内存使用等等。它不一样于其余系统状态监控工具的地方在于，它能够打印历史信息，能够显示当天从零点开始到当前时刻的系统状态信息。若是你系统没有安装这个命令，请使用 yum install -y sysstat 命令安装。初次使用sar命令会报错，那是由于sar工具尚未生成相应的数据库文件（时时监控就不会了，由于不用去查询那个库文件）。它的数据库文件在 “/var/log/sa/” 目录下，默认保存一个月。由于这个命令太过复杂。

yum install -y sysstat 安装后运行命令的时候会报错；这是由于sar的特性，每10分钟才会统计一次。

查看网卡流量 sar -n DEV #sar -n DEV 1 10 1秒显示一次，显示10次

IFACE这列表示设备名称，rxpck/s 表示每秒进入收取的包的数量，txpck/s 表示每秒发送出去的包的数量，rxbyt/s 表示每秒收取的数据量（单位Byte），txbyt/s表示每秒发送的数据量。后面几列不须要关注。若是有一天你所管理的服务器丢包很是严重，那么你就应该看一看这个网卡流量是否异常了，若是rxpck/s 那一列的数值2000左右是正常的，若是上W就不正常了，被攻击了，这个是咱们就要去抓包去查看下一下，正常的服务器网卡流量不会高于这么多，除非是你本身在拷贝数据。上面的命令是查看网卡流量历史的，如什么时候时查看网卡流量呢？

另外也能够查看某一天的网卡流量历史，使用-f选项，后面跟文件名，若是你的系统格式Redhat或者CentOS那么sar的库文件必定是在/var/log/sa/目录下的。: 里面友两种文件一种是sa后面跟的是日期，要用sar -f 打开；还有一种是sar，能够用cat查看；文件里面存的是一个月30天的历史记录。

过了10分钟后，用sar命令就正常了

sar -n DEV -f /var/log/sa/sa05 查看历史流量

sa05这个目录是有规律的，是按日期来的，这个目录最多保存一个月

查看历史负载 sar -q

查看历史磁盘 sar -b

查看历史cpu sar -p

注意：/var/log/sa下面有两个文件

sa10 是当天生成，sar10次日生成
sa10和sar10的区别：sa10要用sa的命令来查看：sar -n DEV -f /var/log/sa/sa10
sar10 能够直接用cat来查看：cat /var/log/sa/sar10
sar -n DEV -f /var/log/sa/sa10
cat /var/log/sa/sar10

nload命令

在安装nload前先装一个扩展包
yum install -y epel-release
yum install -y nload

[root@yong-02 ~]# nload

会出现一个动态的一个实时的网卡页面
网卡名；IP；几个网卡（按方向键选择网卡）

Inconming:进来的带宽（受到攻击的时候流量会很大）
outgoing: 出去的带宽（买的带宽）

使用w查看系统负载 、vmstat、top、sar、nload命令

监控系统状态

load average 平均负载

w：查看当前系统的负载

查看cpu核数的命令：cat /proc/cpuinfo

vmstat工具 ：查看系统瓶颈

proce

memory

swap 显示内容的交换状况

io显示磁盘的使用状况

system显示采集间隔内发生的冲断次数

cpu 显示cpu的使用状态

top 命令：查看具体进程

监控系统状态

sar -n DEV -f /var/log/sa/sa05 查看历史流量

查看历史负载 sar -q

查看历史磁盘 sar -b

查看历史cpu sar -p

nload命令

使用w查看系统负载、vmstat、top、sar、nload命令

vmstat工具：查看系统瓶颈