Linux系统平均负载3个数字的含义解析

时间 2019-12-19

标签 linux 系统平均负载个数含义解析栏目 Linux 繁體版

原文原文链接

愈来愈多人开始接触Linux操做系统，从VPS到无线路由的刷机系统(如OpenWRT、Tomato)，同时也必不可少地会在各式各样的探针和系统监测界面上看到"系统平均负载"或者"Load Average"这样的字眼，可是它并不像咱们习惯中Windows、Mac操做系统提供百分比显示CPU、内存占用率，而是以几个用空格隔开的浮点数来表示系统平均负载，那么它们究竟是什么意思呢？又如何衡量系统负载及系统的稳定性呢？shell

系统平均负载-基本解释安全

在Linux shell下，有不少命令能够看到Load Average，例如：app

  
  
  
  
   
   
   
   root@Slyar.com:~# uptime ide
   
   
   
   12:49:10 up 182 days, 16:54, 2 users, load average: 0.08, 0.04, 0.01 优化
   
   
   
   root@Slyar.com:~# w ui
   
   
   
   12:49:18 up 182 days, 16:54, 2 users, load average: 0.11, 0.07, 0.01 spa
   
   
   
   root@Slyar.com:~# top 操作系统
   
   
   
   top - 12:50:28 up 182 days, 16:55, 2 users, load average: 0.02, 0.05, 0.00 翻译

先大体给一下这3个数字的含义：分别表示系统在过去1分钟、5分钟、15分钟内运行进程队列中的平均进程数量。xml

运行队列嘛，没有等待IO，没有WAIT，没有KILL的进程统统都进这个队列。

另外还有一个最直接的显示系统平均负载的命令：

  
  
  
  
   
   
   
   root@Slyar.com:~# cat /proc/loadavg 
   
   
   
   0.10 0.06 0.01 1/72 29632

除了前3个数字表示平均进程数量外，后面的1个分数，分母表示系统进程总数，分子表示正在运行的进程数；最后一个数字表示最近运行的进程ID.

系统平均负载-进阶解释

只是上面那一句话的解释，基本等于没解释。写这篇文章的原因就是由于看到了一篇老外写的关于Load Average的文章，以为解释的很好，因此才打算摘取一部分用本身的话翻译一下。

@scoutapp Thanks for your article Understanding Linux CPU Load, I just translate and share it to Chinese audiences.

为了更好地理解系统负载，咱们用交通流量来作类比。

一、单核CPU - 单车道 - 数字在0.00-1.00之间正常

路况管理员会告知司机，若是前面比较拥堵，那司机就要等待，若是前面一路畅通，那么司机就能够驾车直接开过。

具体来讲：

0.00-1.00 之间的数字表示此时路况很是良好，没有拥堵，车辆能够毫无阻碍地经过。

1.00 表示道路还算正常，但有可能会恶化并形成拥堵。此时系统已经没有多余的资源了，管理员须要进行优化。

1.00-*** 表示路况不太好了，若是到达2.00表示有桥上车辆一倍数目的车辆正在等待。这种状况你必须进行检查了。

二、多核CPU - 多车道 - 数字/CPU核数在0.00-1.00之间正常

多核CPU的话，满负荷状态的数字为 "1.00 * CPU核数"，即双核CPU为2.00，四核CPU为4.00。

三、安全的系统平均负载

做者认为单核负载在0.7如下是安全的，超过0.7就须要进行优化了。

四、应该看哪个数字，1分钟，5分钟仍是15分钟？

做者认为看5分钟和15分钟的比较好，即后面2个数字。

五、怎样知道个人CPU是几核呢？

使用如下命令能够直接得到CPU核心数目

grep 'model name' /proc/cpuinfo | wc -l

结论

取得CPU核心数目N，观察后面2个数字，用数字/N，若是获得的值小于0.7便可无忧。