判断Linux load的值是否太高

时间 2020-02-18

标签判断 linux load 是否太高栏目 Linux 繁體版

原文原文链接

接触过和使用过unix或linux的朋友，都知道如何查看Unix/Linux load的值，这边我也重复一下查看load的方法：linux

[root@www.linuxidc.com ~]# uptime
13:33:37 up 7 days, 1:52, 1 user, load average: 4.15, 2.00, 3.14
[root@www.linuxidc.com ~]# w
13:35:35 up 1 days, 1:54, 1 user, load average: 0.00, 0.00, 0.00
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
root pts/1 192.168.2.2 13:33 0.00s 0.02s 0.00s w

load average 后面三个值表明系统在1分钟、5分钟和15分钟的负载状况，都知道数字越高表示系统负载越大，第一直觉就是这个系统不行了。load average 是0的时候都认为他很低，10的时候就以为高，20就不用讲了！可是除了这两种极端的状况以外，那何时是这两个值的临界点？当别人问起我这个问题的时候，我也不知道如何回答，在我大脑里就根本就没有考虑过。困扰了我好久，我以为要搞明白他！
bash

先从linux的kernel的源码开始吧！在linux 2.6.36版本中有这样一段代码：ide

/**
* spu_calc_load – update the avenrun load estimates.
*
* No locking against reading these values from userspace, as for
* the CPU loadavg code.
*/
static void spu_calc_load(void)
{
unsigned long active_tasks; /* fixed-point */
active_tasks = count_active_contexts() * FIXED_1;
CALC_LOAD(spu_avenrun[0], EXP_1, active_tasks);
CALC_LOAD(spu_avenrun[1], EXP_5, active_tasks);
CALC_LOAD(spu_avenrun[2], EXP_15, active_tasks);
}
CALC_LOAD是这样定义：
#define LOAD_FREQ (5*HZ+1) /* 5 sec intervals */
#define EXP_1 1884 /* 1/exp(5sec/1min) as fixed-point */
#define EXP_5 2014 /* 1/exp(5sec/5min) */
#define EXP_15 2037 /* 1/exp(5sec/15min) */#define CALC_LOAD(load,exp,n) \
load *= exp; \
load += n*(FIXED_1-exp); \
load >>= FSHIFT;

从这里咱们能看到取负载值的最小周期5秒，根据代码中定义咱们知道
spa

什么是load？线程

load的就是必定时间内计算机有多少个active_tasks，也就是说是计算机的任务执行队列的长度，cpu计算的队列。unix

load多少是正常？code

既然load是cpu计算的队列，那就应该和cpu个处理方式和cpu的个数有关系。因此我我的认为应该按系统识别的cpu个数来肯定load的临界值，系统识别为8个cpu，那么load为8就是临界点，高与8就属于over load了。队列

什么叫系统识别cpu个数？进程

我是这样认为的，这里涉及到cpu物理个数和超线程技术的问题。我的认为4个物理cpu和2个双核是不可以等同的，固然这是物理层面的事了！在系统里识别的都是4个CPU.因此应该要以系统识别的为准。毕竟是系统去支配他的使用。同步

CPU高不等同于load高

在Unix/Linux可能常常会遇到cpu的使用率为100%，可是load却不高！这是为何呢？由于几乎全部的任务和会和CPU进行交互，但是因为各个设备的使用频率不一样，形成了不能同步进行的问题。好比说，当对硬盘进行读写的时候，出现IO的等待时候，事实上cpu已经被切换到别的进程上了。该任务就处于等待状态，当这样的任务过多，致使队列长度过大，这样就体现到负载过大了，但实际是此时cpu被分配去干执行别的任务或空闲，所以CPU 高不等同于load高，load高也不能于cpu高。