深刻 Nodejs 源码探究 CPU 信息的获取与利用率计算

时间 2020-04-09

标签深刻 nodejs 源码探究 cpu 信息获取利用率计算繁體版

原文原文链接

在 Linux 下咱们经过 top 或者 htop 命令能够看到当前的 CPU 资源利用率，另外在一些监控工具中你可能也碰见过，那么它是如何计算的呢？在 Nodejs 中咱们该如何实现？html

带着这些疑问，本节会先从 Linux 下的 CPU 利用率进行一个简单讲解作一下前置知识铺垫，以后会深刻 Nodejs 源码，去探讨如何获取 CPU 信息及计算 CPU 某时间段的利用率。node

开始以前，能够先看一张图，它展现了 Nodejs OS 模块读取系统 CPU 信息的整个过程调用，在下文中也会详细讲解，你会再次看到它。linux

Linux 下 CPU 利用率

Linux 下 CPU 的利用率分为用户态（用户模式下执行时间）、系统态（系统内核执行）、空闲态（空闲系统进程执行时间），三者相加为 CPU 执行总时间，关于 CPU 的活动信息咱们能够在 /proc/stat 文件查看。c++

CPU 利用率是指非系统空闲进程 / CPU 总执行时间。git

> cat /proc/stat
cpu  2255 34 2290 22625563 6290 127 456
cpu0 1132 34 1441 11311718 3675 127 438
cpu1 1123 0 849 11313845 2614 0 18
intr 114930548 113199788 3 0 5 263 0 4 [... lots more numbers ...]
ctxt 1990473 # 自系统启动以来 CPU 发生的上下文交换次数
btime 1062191376 # 启动到如今为止的时间，单位为秒
processes 2915 # 系统启动以来所建立的任务数目
procs_running 1 # 当前运行队列的任务数目
procs_blocked 0 # 当前被阻塞的任务数目
复制代码

上面第一行 cpu 表示总的 CPU 使用状况，下面的cpu0、cpu1 是指系统的每一个 CPU 核心数运行状况（cpu0 + cpu1 + cpuN = cpu 总的核心数），咱们看下第一行的含义。github

user：系统启动开始累计到当前时刻，用户态的 CPU 时间（单位：jiffies），不包含 nice 值为负的进程。
nice：系统启动开始累计到当前时刻，nice 值为负的进程所占用的 CPU 时间。
system：系统启动开始累计到当前时刻，核心时间
idle：从系统启动开始累计到当前时刻，除硬盘IO等待时间之外其它等待时间
iowait：从系统启动开始累计到当前时刻，硬盘IO等待时间
irq：从系统启动开始累计到当前时刻，硬中断时间
softirq：从系统启动开始累计到当前时刻，软中断时间

关于／proc/stat 的介绍，参考这里 www.linuxhowtos.org/System/proc…shell

CPU 某时间段利用率公式

/proc/stat 文件下展现的是系统从启动到当下所累加的总的 CPU 时间，若是要计算 CPU 在某个时间段的利用率，则须要取 t一、t2 两个时间点进行运算。c#

t1～t2 时间段的 CPU 执行时间：api

t1 = (user1 + nice1 + system1 + idle1 + iowait1 + irq1 + softirq1)
t2 = (user2 + nice2 + system2 + idle2 + iowait2 + irq2 + softirq2) 
t = t2 - t1
复制代码

t1～t2 时间段的 CPU 空闲使用时间：数组

idle = (idle2 - idle1)
复制代码

t1～t2 时间段的 CPU 空闲率：

idleRate = idle / t;
复制代码

t1～t2 时间段的 CPU 利用率：

usageRate = 1 - idleRate;
复制代码

上面咱们对 Linux 下 CPU 利用率作一个简单的了解，计算某时间段的 CPU 利用率公式能够先理解下，在下文最后会使用 Nodejs 进行实践。

这块能够扩展下，感兴趣的能够尝试下使用 shell 脚本实现 CPU 利用率的计算。

在 Nodejs 中是如何获取 cpu 信息的？

Nodejs os 模块 cpus() 方法返回一个对象数组，包含每一个逻辑 CPU 内核信息。

提个疑问，这些数据具体是怎么获取的？和上面 Linuv 下的 /proc/stat 有关联吗？带着这些疑问只能从源码中一探究竟。

const os = require('os');

os.cpus();
复制代码

1. JS 层

lib 模块是 Node.js 对外暴露的 js 层模块代码，找到 os.js 文件，如下只保留 cpus 相关核心代码，其中 getCPUs 是经过 internalBinding('os') 导入。

internalBinding 就是连接 JS 层与 C++ 层的桥梁。

// https://github.com/Q-Angelo/node/blob/master/lib/os.js#L41
const {
  getCPUs,
  getFreeMem,
  getLoadAvg,
  ...
} = internalBinding('os');

// https://github.com/Q-Angelo/node/blob/master/lib/os.js#L92
function cpus() {
  // [] is a bugfix for a regression introduced in 51cea61
  const data = getCPUs() || [];
  const result = [];
  let i = 0;
  while (i < data.length) {
    result.push({
      model: data[i++],
      speed: data[i++],
      times: {
        user: data[i++],
        nice: data[i++],
        sys: data[i++],
        idle: data[i++],
        irq: data[i++]
      }
    });
  }
  return result;
}

// https://github.com/Q-Angelo/node/blob/master/lib/os.js#L266
module.exports = {
  cpus,
  ...
};
复制代码

2. C++ 层

2.1 Initialize：

C++ 层代码位于 src 目录下，这一块属于内建模块，是给 JS 层（lib 目录下）提供的 API，在 src/node_os.cc 文件中有一个 Initialize 初始化操做，getCPUs 对应的则是 GetCPUInfo 方法，接下来咱们就要看这个方法的实现。

// https://github.com/Q-Angelo/node/blob/master/src/node_os.cc#L390
void Initialize(Local<Object> target, Local<Value> unused, Local<Context> context, void* priv) {
  Environment* env = Environment::GetCurrent(context);
  env->SetMethod(target, "getCPUs", GetCPUInfo);
  ...
  target->Set(env->context(),
              FIXED_ONE_BYTE_STRING(env->isolate(), "isBigEndian"),
              Boolean::New(env->isolate(), IsBigEndian())).Check();
}
复制代码

2.2 GetCPUInfo 实现：

核心是在 uv_cpu_info 方法经过指针的形式传入 &cpu_infos、&count 两个参数拿到 cpu 的信息和个数 count
for 循环遍历每一个 CPU 核心数据，赋值给变量 ci，遍历过程当中 user、nice、sys... 这些数据就很熟悉了，正是咱们在 Nodejs 中经过 os.cpus() 拿到的，这些数据都会保存在 result 对象中
遍历结束，经过 uv_free_cpu_info 对 cpu_infos、count 进行回收
最后，设置参数 Array::New(isolate, result.data(), result.size()) 以数组形式返回。

// https://github.com/Q-Angelo/node/blob/master/src/node_os.cc#L113
static void GetCPUInfo(const FunctionCallbackInfo<Value>& args) {
  Environment* env = Environment::GetCurrent(args);
  Isolate* isolate = env->isolate();

  uv_cpu_info_t* cpu_infos;
  int count;

  int err = uv_cpu_info(&cpu_infos, &count);
  if (err)
    return;

  // It's faster to create an array packed with all the data and
  // assemble them into objects in JS than to call Object::Set() repeatedly
  // The array is in the format
  // [model, speed, (5 entries of cpu_times), model2, speed2, ...]
  std::vector<Local<Value>> result(count * 7);
  for (int i = 0, j = 0; i < count; i++) {
    uv_cpu_info_t* ci = cpu_infos + i;
    result[j++] = OneByteString(isolate, ci->model);
    result[j++] = Number::New(isolate, ci->speed);
    result[j++] = Number::New(isolate, ci->cpu_times.user);
    result[j++] = Number::New(isolate, ci->cpu_times.nice);
    result[j++] = Number::New(isolate, ci->cpu_times.sys);
    result[j++] = Number::New(isolate, ci->cpu_times.idle);
    result[j++] = Number::New(isolate, ci->cpu_times.irq);
  }

  uv_free_cpu_info(cpu_infos, count);
  args.GetReturnValue().Set(Array::New(isolate, result.data(), result.size()));
}
复制代码

3. Libuv 层

通过上面 C++ 内建模块的分析，其中一个重要的方法 uv_cpu_info 是用来获取数据源，如今就要找它啦

3.1 node_os.cc：

内建模块 node_os.cc 引用了头文件 env-inl.h

// https://github.com/Q-Angelo/node/blob/master/src/node_os.cc#L22
#include "env-inl.h"

...
复制代码

3.2 env-inl.h：

env-inl.h 处又引用了 uv.h

// https://github.com/Q-Angelo/node/blob/master/src/env-inl.h#L31
#include "uv.h"
复制代码

3.3 uv.h：

.h（头文件）包含了类里面成员和方法的声明，它不包含具体的实现，声明找到了，下面找下它的具体实现。

除了咱们要找的 uv_cpu_info，此处还声明了 uv_free_cpu_info 方法，与之对应主要用来作回收，上文 C++ 层在数据遍历结束就使用的这个方法对参数 cpu_infos、count 进行了回收。

/* https://github.com/Q-Angelo/node/blob/master/deps/uv/include/uv.h#L1190 */
UV_EXTERN int uv_cpu_info(uv_cpu_info_t** cpu_infos, int* count);
UV_EXTERN void uv_free_cpu_info(uv_cpu_info_t* cpu_infos, int count);
复制代码

Libuv 层只是对下层操做系统的一种封装，下面来看操做系统层的实现。

4. OS 操做系统层

4.1 linux-core.c：

在 deps/uv/ 下搜索 uv_cpu_info，会发现它的实现有不少 aix、cygwin.c、darwin.c、freebsd.c、linux-core.c 等等各类系统的，按照名字也能够看出 linux-core.c 彷佛就是 Linux 下的实现了，重点也来看下这个的实现。

uv__open_file("/proc/stat") 参数 /proc/stat 这个正是 Linux 下 CPU 信息的位置。

// https://github.com/Q-Angelo/node/blob/master/deps/uv/src/unix/linux-core.c#L610

int uv_cpu_info(uv_cpu_info_t** cpu_infos, int* count) {
  unsigned int numcpus;
  uv_cpu_info_t* ci;
  int err;
  FILE* statfile_fp;

  *cpu_infos = NULL;
  *count = 0;

  statfile_fp = uv__open_file("/proc/stat");
  ...
}
复制代码

4.2 core.c：

最终找到 uv__open_file() 方法的实现是在 /deps/uv/src/unix/core.c 文件，它以只读和执行后关闭模式获取一个文件的指针。

到这里也就该明白了，Linux 平台下咱们使用 Nodejs os 模块的 cpus() 方法最终也是读取的 /proc/stat 文件获取的 CPU 信息。

// https://github.com/Q-Angelo/node/blob/master/deps/uv/src/unix/core.c#L455
/* get a file pointer to a file in read-only and close-on-exec mode */
FILE* uv__open_file(const char* path) {
  int fd;
  FILE* fp;

  fd = uv__open_cloexec(path, O_RDONLY);
  if (fd < 0)
    return NULL;

   fp = fdopen(fd, "r");
   if (fp == NULL)
     uv__close(fd);

   return fp;
}
复制代码

何时该定位到 win 目录下？何时定位到 unix 目录下？

这取决于 Libuv 层，在“深刻浅出 Nodejs” 一书中有这样一段话：“Node 在编译期间会判断平台条件，选择性编译 unix 目录或是 win 目录下的源文件到目标程序中”，因此这块是在编译时而非运行时来肯定的。

5. 一图胜千言

经过对 OS 模块读取 CPU 信息流程梳理，再次展示 Nodejs 的经典架构：

JavaScript -> internalBinding -> C++ -> Libuv -> OS

在 Nodejs 中实践

了解了上面的原理以后在来 Nodejs 中实现，已经再简单不过了，系统层为咱们提供了完美的 API 调用。

os.cpus() 数据指标

Nodejs os.cpus() 返回的对象数组中有一个 times 字段，包含了 user、nice、sys、idle、irq 几个指标数据，分别表明 CPU 在用户模式、良好模式、系统模式、空闲模式、中断模式下花费的毫秒数。相比 linux 下，直接经过 cat /proc/stat 查看更直观了。

[
  {
    model: 'Intel(R) Core(TM) i7 CPU 860 @ 2.80GHz',
    speed: 2926,
    times: {
      user: 252020,
      nice: 0,
      sys: 30340,
      idle: 1070356870,
      irq: 0
    }
	}
	...
复制代码

Nodejs 中编码实践

定义方法 _getCPUInfo 用来获取系统 CPU 信息。

方法 getCPUUsage 提供了 CPU 利用率的 “实时” 监控，这个 “实时” 不是绝对的实时，总会有时差的，咱们下面实现中默认设置的 1 秒钟，可经过 Options.ms 进行调整。

const os = require('os');
const sleep = ms => new Promise(resolve => setTimeout(resolve, ms));

class OSUtils {
  constructor() {
    this.cpuUsageMSDefault = 1000; // CPU 利用率默认时间段
  }

  /** * 获取某时间段 CPU 利用率 * @param { Number } Options.ms [时间段，默认是 1000ms，即 1 秒钟] * @param { Boolean } Options.percentage [true（以百分比结果返回）|false] * @returns { Promise } */
  async getCPUUsage(options={}) {
    const that = this;
    let { cpuUsageMS, percentage } = options;
    cpuUsageMS = cpuUsageMS || that.cpuUsageMSDefault;
    const t1 = that._getCPUInfo(); // t1 时间点 CPU 信息

    await sleep(cpuUsageMS);

    const t2 = that._getCPUInfo(); // t2 时间点 CPU 信息
    const idle = t2.idle - t1.idle;
    const total = t2.total - t1.total;
    let usage = 1 - idle / total;

    if (percentage) usage = (usage * 100.0).toFixed(2) + "%";

    return usage;
  }

  /** * 获取 CPU 信息 * @returns { Object } CPU 信息 */
  _getCPUInfo() {
    const cpus = os.cpus();
    let user = 0, nice = 0, sys = 0, idle = 0, irq = 0, total = 0;

    for (let cpu in cpus) {
      const times = cpus[cpu].times;
      user += times.user;
      nice += times.nice;
      sys += times.sys;
      idle += times.idle;
      irq += times.irq;
    }

    total += user + nice + sys + idle + irq;

    return {
      user,
      sys,
      idle,
      total,
    }
  }
}
复制代码

使用方式以下所示：

const cpuUsage = await osUtils.getCPUUsage({ percentage: true });
console.log('CPU 利用率：', cpuUsage) // CPU 利用率： 13.72%
复制代码

总结

本文先从 Linux 下 CPU 利用率的概念作一个简单的讲解，以后深刻 Nodejs OS 模块源码对获取系统 CPU 信息进行了梳理，另外一方面也再次呈现了 Nodejs 经典的架构 JavaScript -> internalBinding -> C++ -> Libuv -> OS 这对于梳理其它 API 是通用的，能够作为必定的参考，最后使用 Nodejs 对 CPU 利用率的计算进行了实践。