Node.js 事件循环

时间 2019-11-26 标签 node.js node 事件循环

本文地址 http://www.cnblogs.com/jasonxuli/p/6074231.html

原文： https://github.com/nodejs/node/blob/master/doc/topics/event-loop-timers-and-nexttick.md

>>> 文末有简单总结

什么是事件循环（Event Loop）

事件循环能让 Node.js 执行非阻塞 I/O 操做 -- 尽管JavaScript事实上是单线程的 -- 经过在可能的状况下把操做交给操做系统内核来实现。

因为大多数现代系统内核是多线程的，内核能够处理后台执行的多个操做。当其中一个操做完成的时候，内核告诉 Node.js，相应的回调就被添加到轮询队列（poll queue）并最终获得执行。本主题随后会解释更多相关细节。

事件循环

Node.js 开始的时候会初始化事件循环，处理目标脚本，脚本可能会进行异步API调用、定时任务或者process.nextTick()，而后开始进行事件循环。

下面的表格简要描述了事件循环的操做顺序。

     ┌───────────────────────┐
┌─> │        timers                        │
│   └──────────┬────────────┘
│   ┌──────────┴────────────┐
│   │     I/O callbacks                    │
│   └──────────┬────────────┘
│   ┌──────────┴────────────┐
│   │     idle, prepare                    │
│   └──────────┬────────────┘      ┌───────────────┐
│   ┌──────────┴────────────┐      │   incoming:             │
│   │         poll                         │<───┤  connections,           │
│   └──────────┬────────────┘      │   data, etc.            │
│   ┌──────────┴────────────┐      └───────────────┘
│   │        check                         │
│   └──────────┬────────────┘
│   ┌──────────┴────────────┐
└──┤    close callbacks                   │

└──────────────────────———————─┘

注：每一个方框表明事件循环中的一个阶段。

每一个阶段都有一个须要执行的回调函数的先入先出（FIFO）队列。同时，每一个阶段都是特殊的，基本上，当事件循环进行到某个阶段时，会执行该阶段特有的操做，而后执行该阶段队列中的回调，直到队列空了或者达到了执行次数限制。这时候，事件循环会进入下一个阶段，循环往复。

因为这些操做可能产生更多的计划任务操做，而且轮询阶段处理的新事件会被加入到内核的队列，轮询事件被处理的时候会有新的轮询事件加入。因而，长时回调任务会致使轮询阶段的时间超过了定时器的阈值。详情见定时器（timers）和轮询（poll）部分。

注：Windows 和 Unix/Linux 的实现有轻微的矛盾之处，但并不影响刚才的描述。最重要的部分都有了。实际上有七八个阶段，但咱们关注的 -- Node.js 实际使用的 -- 就是上面这些。

阶段总览（Phases Overview）

计时器（timers）：本阶段执行setTimeout() 和 setInterval() 计划的回调；
I/O 回调：执行几乎所有发生异常的 close 回调，由定时器和setImmediate()计划的回调；
空闲，预备（idle，prepare）：只内部使用；
轮询（poll）：获取新的 I/O 事件；nodejs这时会适当进行阻塞；
检查（check）：调用 setImmediate() 的回调；
close callbacks：例如 socket.on('close', ... );

在事件循环运行之间，Node.js 检查是否有正在等待的异步I/O 或者定时器，若是没有就清除并结束。

阶段细节

定时器（timers）

定时器的用途是让指定的回调函数在某个阈值后会被执行，具体的执行时间并不必定是那个精确的阈值。定时器的回调会在制定的时间事后尽快获得执行，然而，操做系统的计划或者其余回调的执行可能会延迟该回调的执行。

注：从技术上来看，轮询阶段控制了定时器的执行时机。

例如，你设定了在100ms后执行某个操做，而后脚本开始执行一个须要95ms的文件读取操做：

var fs = require('fs');

function someAsyncOperation (callback) { // Assume this takes 95ms to complete fs.readFile('/path/to/file', callback); } var timeoutScheduled = Date.now(); setTimeout(function () { var delay = Date.now() - timeoutScheduled; console.log(delay + "ms have passed since I was scheduled"); }, 100); // do someAsyncOperation which takes 95 ms to completesomeAsyncOperation(function () { var startCallback = Date.now(); // do something that will take 10ms... while (Date.now() - startCallback < 10) { ; // do nothing  } });

当事件循环进入轮询阶段时，队列是空的（fs.readFile()还没完成），所以时间会继续流逝知道最快的定时器须要执行。过了95ms后，fs.readFile() 读完文件了，它的回调被添加到轮询队列，这个回调须要执行10ms。等到这个回调执行完，队列中没有回调了，这时事件循环看到了最近到时的定时器，而后回到定时器阶段（timers phase）来执行以前的定时器回调。

在这个例子中，从定义定时器到回调执行中间过了105ms。

注：为了防止轮询阶段持续时间太长，libuv 会根据操做系统的不一样设置一个轮询的上限。

I/O callbacks

这个阶段执行一些诸如TCP错误之类的系统操做的回调。例如，若是一个TCP socket 在尝试链接时收到了 ECONNREFUSED错误，某些 *nix 系统会等着报告这个错误。这个就会被排到本阶段的队列中。

轮询（poll）

轮询阶段有两个主要功能：

1，执行已经到时的定时器脚本，而后

2，处理轮询队列中的事件。

当事件循环进入到轮询阶段却没有发现定时器时：

若是轮询队列非空，事件循环会迭代回调队列并同步执行回调，直到队列空了或者达到了上限（前文说过的根据操做系统的不一样而设定的上限）。
若是轮询队列是空的：
- 若是有setImmediate()定义了回调，那么事件循环会终止轮询阶段并进入检查阶段去执行定时器回调；
- 若是没有setImmediate()，事件回调会等待回调被加入队列并当即执行。

一旦轮询队列空了，事件循环会查找已经到时的定时器。若是找到了，事件循环就回到定时器阶段去执行回调。

检查（check）

这个阶段容许回调函数在轮询阶段完成后当即执行。若是轮询阶段空闲了，而且有回调已经被 setImmediate() 加入队列，事件循环会进入检查阶段而不是在轮询阶段等待。

setImmediate() 是个特殊的定时器，在事件循环中一个单独的阶段运行。它使用libuv的API 来使得回调函数在轮询阶段完成后执行。

基本上，随着代码的执行，事件循环会最终进入到等待状态的轮询阶段，多是等待一个链接、请求等。然而，若是有一个setImmediate() 设置了一个回调而且轮询阶段空闲了，那么事件循环会进入到检查阶段而不是等待轮询事件。 ---- 这车轱辘话说来讲去的

关闭事件的回调（close callbacks）

若是一个 socket 或句柄（handle）被忽然关闭（is closed abruptly），例如 socket.destroy()， 'close' 事件会被发出到这个阶段。不然这种事件会经过 process.nextTick() 被发出。

setImmediate() vs setTimeout()

这两个很类似，但调用时机会的不一样会致使它们不一样的表现。

setImmediate() 被设计成一旦轮询阶段完成就执行回调函数；
setTimeout() 规划了在某个时间值事后执行回调函数；

这两个执行的顺序会由于它们被调用时的上下文而有所不一样。若是都是在主模块调用，那么它们会受到进程性能的影响（运行在本机的其余程序会影响它们）。

例如，若是咱们在非 I/O 循环中运行下面的脚本（即在主模块中），他俩的顺序是不固定的，由于会受到进程性能的影响：

// timeout_vs_immediate.jssetTimeout(function timeout () {
  console.log('timeout');
},0); setImmediate(function immediate () { console.log('immediate'); });

$ node timeout_vs_immediate.js

timeout

immediate

$ node timeout_vs_immediate.js

immediate

timeout

可是若是把它们放进 I/O 循环中，setImmediate() 的回调老是先执行：

// timeout_vs_immediate.jsvar fs = require('fs')

fs.readFile(__filename, () => { setTimeout(() => { console.log('timeout') }, 0) setImmediate(() => { console.log('immediate') }) })

$ node timeout_vs_immediate.js

immediate

timeout

$ node timeout_vs_immediate.js

immediate

timeout

setImmediate() 比 setTimeout() 优点的地方是 setImmediate() 在 I/O 循环中老是先于任何定时器，无论已经定义了多少定时器。

process.nextTick()

理解 process.nextTick()

你可能已经注意到了 process.nextTick() 没有在上面那个表格里出现，虽然它确实是一个异步API。这是由于它技术上不属于事件循环。然而，nextTickQueue 会在当前操做结束后被处理，不论是在事件循环的哪一个阶段。

回头看看以前那个表格，你在某个阶段的任什么时候候调用它，它的全部回调函数都会在事件循环继续进行以前获得处理。有时候这会致使比较糟糕的状况，由于它容许你用递归调用的方式去“阻塞” I/O，这会让事件循环没法进入到轮询阶段。

为何要容许这样

部分是由于 Node.js 的设计哲学：API 应该老是异步的，即便本不须要是异步。

blablabla，后面几段看的我有点尴尬+晕。既尴尬又晕是以为这几段说的有点啰嗦，并且举的例子不合适。例子要么是同步的，不是异步的。要么是例子里的写法彻底能够避免，好比应该先添加 'connect' 事件监听再进行 .connect() 操做；又或者变量声明最好放在变量使用以前，能够避免变量的提早声明和当时赋值的麻烦。

难道是我没理解里面的秘辛？

process.nextTick() vs setTimeout()

这两个函数有些类似可是名字让人困惑：

process.netxtTick() 在事件循环的当前阶段当即生效；
setImmediate() 生效是在接下来的迭代或者事件循环的下一次tick；

本质上，它们的名字应该互换一下。process.nextTick() 比 setImmediate() 更“马上”执行，但这是个历史问题无法改变。若是改了，npm上大堆的包就要挂了。

咱们推荐开发者在全部状况下都使用 setImmediate() 由于它更显而易见（reason about），另外兼容性也更广，例如浏览器端。

为何使用 process.nextTick()

有两大缘由：

容许用户处理错误，清理不须要的资源，或许在事件循环结束前再次尝试发送请求；
必须让回调函数在调用栈已经清除（unwound）后而且事件循环继续下去以前执行；

下面的两个例子都是相似的，即在 line1 派发事件，却在 line2 才添加监听，所以监听的回调是不可能被执行到的。

因而能够用 process.nextTick() 使得当前调用栈先执行完毕，也即先执行 line2 注册事件监听，而后在 nextTick 派发事件。

const EventEmitter = require('events');
const util = require('util'); function MyEmitter() { EventEmitter.call(this); // use nextTick to emit the event once a handler is assigned process.nextTick(function () { this.emit('event'); }.bind(this)); } util.inherits(MyEmitter, EventEmitter); const myEmitter = new MyEmitter(); myEmitter.on('event', function() { console.log('an event occurred!'); });

翻译总结：

这篇文章写的不太简练，也可能为了有更多的受众吧，我感受车轱辘话比较多，一个意思要说好几遍。

从编程应用的角度简单来讲：

Node.js 中的事件循环大概有七八个阶段，每一个阶段都有本身的队列（queue），须要等本阶段的队列处理完成后才进入其余阶段。阶段之间会互相转换，循环顺序并非彻底固定的，由于不少阶段是由外部的事件触发的。

其中比较重要的是三个：

定时器阶段 timers：
定时器阶段执行定时器任务（setTimeOut(), setInterval()）。
轮询阶段 poll：

轮询阶段由 I/O 事件触发，例如 'connect'，'data' 等。这是比较重/重要的阶段，由于大部分程序功能就是为了 I/O 数据。

本阶段会处理定时器任务和 poll 队列中的任务，具体逻辑：

- 处理到期的定时器任务，而后
- 处理队列任务，直到队列空了或者达到上限
- 若是队列任务没了：
- - 若是有 setImmediate()，终止轮询阶段并进入检查阶段去执行；
  - 若是没有 setImmediate()，那么就查看有没有到期的定时器，有的话就回到定时器阶段执行回调函数；

检查阶段 check：

当轮询阶段空闲而且已经有 setImmediate() 的时候，会进入检查阶段并执行。

比较次要但也列在表格中的两个：

I/O 阶段：

本阶段处理 I/O 异常错误；

'close'事件回调：

本阶段处理各类 'close' 事件回调；

关于 setTimeout(), setImmediate(), process.nextTick()：

setTimeout() 在某个时间值事后尽快执行回调函数；
setImmediate() 一旦轮询阶段完成就执行回调函数；
process.nextTick() 在当前调用栈结束后就当即处理，这时也必然是“事件循环继续进行以前” ；

优先级顺序从高到低： process.nextTick() > setImmediate() > setTimeout()

注：这里只是多数状况下，即轮询阶段（I/O 回调中）。好比以前比较 setImmediate() 和 setTimeout() 的时候就区分了所处阶段/上下文。

另：

关于调用栈，事件循环还能够参考这篇文章：

https://blog.risingstack.com/node-js-at-scale-understanding-node-js-event-loop/

这篇文章里对事件任务区分了大任务(macro task) 、小任务(micro task)，每一个事件循环只处理一个大任务，但会处理完全部小任务。

这一点和前面的文章说的不一样。

examples of microtasks:html

process.nextTick
promises
Object.observe

examples of macrotasks:node

setTimeout
setInterval
setImmediate
I/O