nodejs 异步I/O和事件驱动

nodejs 异步I/O和事件驱动

注:本文是对众多博客的学习和总结,可能存在理解错误。请带着怀疑的眼光,同时若是有错误但愿能指出。javascript

接触nodejs有两个月,对nodejs的两大特性一直有点模糊,即异步IO事件驱动。经过对《深刻浅出nodejs》和几篇博客的阅读之后,有了大体的了解,总结一下。html

几个例子

在开始以前,先来看几个简单例子,这也是我在使用nodejs时候遇到的几个比较困惑的例子。java


example 1

var fs = require("fs");
var debug = require('debug')('example1');

debug("begin");

setTimeout(function(){
    debug("timeout1");
});

setTimeout(function(){
    debug("timeout2");
});

debug('end');
/** 运行结果
Sat, 21 May 2016 08:41:09 GMT example1 begin
Sat, 21 May 2016 08:41:09 GMT example1 end
Sat, 21 May 2016 08:41:09 GMT example1 timeout1
Sat, 21 May 2016 08:41:09 GMT example1 timeout2
*/

question 1node

为什么timeout1timeout2的结果会在end后面?linux


example 2

var fs = require("fs");
var debug = require('debug')('example2');

debug("begin");

setTimeout(function(){
    debug("timeout1");
});

setTimeout(function(){
    debug("timeout2");
});

debug('end');

while(true);
/**  运行结果
Sat, 21 May 2016 08:45:47 GMT example2 begin
Sat, 21 May 2016 08:45:47 GMT example2 end
*/

question 2git

为什么timeout1timeout2没有输出到终端?while(true)到底阻塞了什么?github


example 3

var fs = require("fs");
var debug = require('debug')('example3');

debug("begin");

setTimeout(function(){
    debug("timeout1");
    while (true);
});

setTimeout(function(){
    debug("timeout2");
});

debug('end');
/**  运行结果
Sat, 21 May 2016 08:49:12 GMT example3 begin
Sat, 21 May 2016 08:49:12 GMT example3 end
Sat, 21 May 2016 08:49:12 GMT example3 timeout1
*/

question 3编程

为何timeout1中回调函数会阻塞timeout2中的回调函数的执行?json


example 4

var fs = require("fs");
var debug = require('debug')('example4');

debug("begin");

setTimeout(function(){
    debug("timeout1");
    /**
     * 模拟计算密集
     */
    for(var i = 0 ; i < 1000000 ; ++i){
        for(var j = 0 ; j < 100000 ; ++j);
    }
});

setTimeout(function(){
    debug("timeout2");
});

debug('end');
/**
Sat, 21 May 2016 08:53:27 GMT example4 begin
Sat, 21 May 2016 08:53:27 GMT example4 end
Sat, 21 May 2016 08:53:27 GMT example4 timeout1
Sat, 21 May 2016 08:54:09 GMT example4 timeout2  //注意这里的时间晚了很久
*/

question 4segmentfault

和上面的问题同样,为什么timeout1的计算密集型工做将会阻塞timeout2的回调函数的执行?


example 5

var fs = require("fs");
var debug = require('debug')('example5');

debug("begin");

fs.readFile('package.json','utf-8',function(err,data){
    if(err)  
        debug(err);
    else
        debug("get file content");
});

setTimeout(function(){
    debug("timeout2");
});

debug('end');
/** 运行结果
Sat, 21 May 2016 08:59:14 GMT example5 begin
Sat, 21 May 2016 08:59:14 GMT example5 end
Sat, 21 May 2016 08:59:14 GMT example5 timeout2
Sat, 21 May 2016 08:59:14 GMT example5 get file content
*/

question 5

为什么读取文件的IO操做不会阻塞timeout2的执行?


接下来咱们就带着上面几个疑惑去理解nodejs中的异步IO事件驱动是如何工做的。

异步IO(asynchronous I/O)

首先来理解几个容易混淆的概念,阻塞IO(blocking I/O)非阻塞IO(non-blocking I/O)同步IO(synchronous I/O)和异步IO(synchronous I/O)

博主一直天真的觉得非阻塞I/O就是异步I/O T_T,apue一直没有读懂。

阻塞I/O 和 非阻塞I/O

简单来讲,阻塞I/O就是当用户发一个读取文件描述符的操做的时候,进程就会被阻塞,直到要读取的数据所有准备好返回给用户,这时候进程才会解除block的状态。

非阻塞I/O呢,就与上面的状况相反,用户发起一个读取文件描述符操做的时,函数当即返回,不做任何等待,进程继续执行。可是程序如何知道要读取的数据已经准备好了呢?最简单的方法就是轮询。

除此以外,还有一种叫作IO多路复用的模式,就是用一个阻塞函数同时监听多个文件描述符,当其中有一个文件描述符准备好了,就立刻返回,在linux下,select,poll,epoll都提供了IO多路复用的功能。

同步I/O 和 异步I/O

那么同步I/O异步I/O又有什么区别么?是否是只要作到非阻塞IO就能够实现异步I/O呢?

其实否则。

  • 同步I/O(synchronous I/O)I/O operation的时候会将process阻塞,因此阻塞I/O非阻塞I/OIO多路复用I/O都是同步I/O

  • 异步I/O(asynchronous I/O)I/O opertaion的时候将不会形成任何的阻塞。

非阻塞I/O都不阻塞了为何不是异步I/O呢?其实当非阻塞I/O准备好数据之后仍是要阻塞住进程去内核拿数据的。因此算不上异步I/O

这里借一张图(图来自这里)来讲明他们之间的区别

![Alt text\][1]

更多IO更多的详细内容能够在这里找到:

事件驱动

事件驱动(event-driven)nodejs中的第二大特性。何为事件驱动呢?简单来讲,就是经过监听事件的状态变化来作出相应的操做。好比读取一个文件,文件读取完毕,或者文件读取错误,那么就触发对应的状态,而后调用对应的回掉函数来进行处理。

线程驱动和事件驱动

那么线程驱动编程和事件驱动编程之间的区别是什么呢?

  • 线程驱动就是当收到一个请求的时候,将会为该请求开一个新的线程来处理请求。通常存在一个线程池,线程池中有空闲的线程,会从线程池中拿取线程来进行处理,若是线程池中没有空闲的线程,新来的请求将会进入队列排队,直到线程池中空闲线程。

  • 事件驱动就是当进来一个新的请求的时,请求将会被压入队列中,而后经过一个循环来检测队列中的事件状态变化,若是检测到有状态变化的事件,那么就执行该事件对应的处理代码,通常都是回调函数。

对于事件驱动编程来讲,若是某个时间的回调函数是计算密集型,或者是阻塞I/O,那么这个回调函数将会阻塞后面全部事件回调函数的执行。这一点尤其重要。

nodejs的事件驱动和异步I/O

事件驱动模型

上面介绍了那么多的概念,如今咱们来看看nodejs中的事件驱动异步I/O是如何实现的.

nodejs单线程(single thread)运行的,经过一个事件循环(event-loop)来循环取出消息队列(event-queue)中的消息进行处理,处理过程基本上就是去调用该消息对应的回调函数。消息队列就是当一个事件状态发生变化时,就将一个消息压入队列中。

nodejs的时间驱动模型通常要注意下面几个点:

  • 由于是单线程的,因此当顺序执行js文件中的代码的时候,事件循环是被暂停的。

  • js文件执行完之后,事件循环开始运行,并从消息队列中取出消息,开始执行回调函数

  • 由于是单线程的,因此当回调函数被执行的时候,事件循环是被暂停的

  • 当涉及到I/O操做的时候,nodejs会开一个独立的线程来进行异步I/O操做,操做结束之后将消息压入消息队列

下面咱们从一个简单的js文件入手,来看看 nodejs是如何执行的。

var fs = require("fs");
var debug = require('debug')('example1');

debug("begin");

fs.readFile('package.json','utf-8',function(err,data){
    if(err)  
        debug(err);
    else
        debug("get file content");
});

setTimeout(function(){
    debug("timeout2");
});

debug('end'); // 运行到这里以前,事件循环是暂停的
  1. 同步执行debug("begin")

  2. 异步调用fs.readFile(),此时会开一个新的线程去进行异步I/O操做

  3. 异步调用setTimeout(),立刻将超时信息压入到消息队列

  4. 同步调用debug("end")

  5. 开启事件循环,弹出消息队列中的信息(目前是超时信息)

  6. 而后执行信息对应的回调函数(事件循环又被暂停)

  7. 回调函数执行结束后,开始事件循环(目前消息队列中没有任何东西,文件还没读完)

  8. 异步I/O读取文件完毕,将消息压入消息队列(消息中含有文件内容或者是出错信息)

  9. 事件循环取得消息,执行回调

  10. 程序退出。

这里借一张图来讲明nodejs的事件驱动模型(图来自这里
![这里写图片描述\][2]

这里最后要说的一点就是如何手动将一个函数推入队列,nodejs为咱们提供了几个比较方便的方法:

  • setTimeout()

  • process.nextTick()

  • setImmediate()

异步I/O

nodejs中的异步I/O的操做是经过libuv这个库来实现的,包含了windowlinux下面的异步I/O实现,博主也没有研究过这个库,感兴趣的读者能够移步到这里

问题答案

好,到目前为止,已经能够回答上面的问题了


question 1

为什么timeout1timeout2的结果会在end后面?

answer 1

由于此时timeout1timeout2只是被异步函数推入到了队列中,事件循环仍是暂停状态


question 2

为什么timeout1timeout2没有输出到终端?while(true)到底阻塞了什么?

answer 2

由于此处直接阻塞了事件循环,还没开始,就已经被阻塞了


question 3,4

  1. 为何timeout1中回调函数会阻塞timeout2中的回调函数的执行?

  2. 为什么timeout1的计算密集型工做将会阻塞timeout2的回调函数的执行?

answer 3,4

由于该回调函数执行返回事件循环才会继续执行,回调函数将会阻塞事件循环的运行


question 5

为什么读取文件的IO操做不会阻塞timeout2的执行?

answer 5

由于IO操做是异步的,会开启一个新的线程,不会阻塞到事件循环


参考文献:

相关文章
相关标签/搜索