浅析 Node.js 单线程模型

时间 2019-11-29

标签浅析 node.js node 单线模型栏目 Node.js 繁體版

原文原文链接

总结笔记：对于每一个用户请求，由主线程接收并存放于一个事件队列中（不作任何处理），当无请求发生时，即主线程空闲，主线程开始循环处理事件队列中的任务：html

对于非阻塞JS程序：node

一、若某事件须要I/O操做，则主线程发出I/O请求，而后继续执行，由底层的程序实现I/O并返回I/O数据（底层程序是多线程的，JS是单线程的），底层I/O线程处理完后将该事件从新放入事件队列并释放当前线程；数据库

二、某事件不须要I/O操做，则主线程直接处理；（由其余线程处理后放入的事件此时也被主线程直接处理掉）；数组

对于阻塞JS程序：服务器

一、若某事件须要I/O操做，则主线程发出I/O请求，而后等待I/O结束，由底层的程序实现I/O并返回I/O数据，主线程得到该事件所需数据后继续处理该事件；数据结构

二、某事件不须要I/O操做，则主线程直接处理；多线程

综上可知，node.js由js解释程序和底层代码实现，JS代码是主线程，是单线程执行，而底层代码是多线程，可同时处理多个I/O请求，js中的阻塞与非阻塞代码只决定js在I/O时继不继续执行（固然，若阻塞执行，底层多线程也没啥用了），而底层会为每个I/O请求建立一个线程；并发

注意：这只是对Node.js的一个分析，用来理解nodejs的线程模型而已，实际使用要具体问题具体分析，建议结合http://www.runoob.com/nodejs/nodejs-callback.html中的阻塞与非阻塞来学习，阻塞即只要一个主线程执行全部操做，当事件须要I/O操做则主线程等待I/O完成再继续执行，而非阻塞，即对事件处理使用了事件回调，此时，主线程将继续执行下一步的代码而不用等待该事件I/O完成，当I/O完成时主线程再针对该事件执行相应的回调函数；异步

例如：一、函数

var http = require('http'); http.createServer(function (request, response) {     // 发送 HTTP 头部      // HTTP 状态值: 200 : OK     // 内容类型: text/plain     response.writeHead(200, {'Content-Type': 'text/plain'});     // 发送响应数据 "Hello World"     response.end('Hello World\n'); }).listen(8888); // 终端打印以下信息 console.log('Server running at http://127.0.0.1:8888/');

该主线程只作三件事：一、侦听8888端口（侦听操做也能够理解为是I/O操做，于是应当也是由底层程序实现，即底层程序监听端口，如有事件，则放入事件队列，继续侦听端口）；二、JS主线程处理并生成返回数据；三、返回处理结果（此步骤是I/O操做，由线程池处理）；

二、

var fs = require("fs"); fs.readFile('input.txt', function (err, data) { if (err) return console.error(err); console.log(data.toString()); }); console.log("程序执行结束!");

该主线程在执行I/O时不等待I/O完成，直接继续执行，线程池线程执行完后将结果返还给主线程，主线程执行回调函数并处理事件；

正文

Node.js 采用事件驱动和异步 I/O 的方式，实现了一个单线程、高并发的 JavaScript 运行时环境，而单线程就意味着同一时间只能作一件事，那么 Node.js 如何经过单线程来实现高并发和异步 I/O？本文将围绕这个问题来探讨 Node.js 的单线程模型。

一、高并发策略

通常来讲，高并发的解决方案就是提供多线程模型，服务器为每一个客户端请求分配一个线程，使用同步 I/O，系统经过线程切换来弥补同步 I/O 调用的时间开销。好比 Apache 就是这种策略，因为 I/O 通常都是耗时操做，所以这种策略很难实现高性能，但很是简单，能够实现复杂的交互逻辑。

而事实上，大多数网站的服务器端都不会作太多的计算，它们接收到请求之后，把请求交给其它服务来处理（好比读取数据库），而后等着结果返回，最后再把结果发给客户端。所以，Node.js 针对这一事实采用了单线程模型来处理，它不会为每一个接入请求分配一个线程，而是用一个主线程处理全部的请求，而后对 I/O 操做进行异步处理，避开了建立、销毁线程以及在线程间切换所需的开销和复杂性。

二、事件循环

Node.js 在主线程里维护了一个事件队列，当接到请求后，就将该请求做为一个事件放入这个队列中，而后继续接收其余请求。当主线程空闲时(没有请求接入时)，就开始循环事件队列，检查队列中是否有要处理的事件，这时要分两种状况：若是是非 I/O 任务，就亲自处理，并经过回调函数返回到上层调用；若是是 I/O 任务，就从线程池中拿出一个线程来处理这个事件，并指定回调函数，而后继续循环队列中的其余事件。

当线程中的 I/O 任务完成之后，就执行指定的回调函数，并把这个完成的事件放到事件队列的尾部，等待事件循环，当主线程再次循环到该事件时，就直接处理并返回给上层调用。这个过程就叫事件循环 (Event Loop)，其运行原理以下图所示：

这个图是整个 Node.js 的运行原理，从左到右，从上到下，Node.js 被分为了四层，分别是应用层、V8引擎层、Node API层和 LIBUV层。

应用层：即 JavaScript 交互层，常见的就是 Node.js 的模块，好比 http，fs
V8引擎层：即利用 V8 引擎来解析JavaScript 语法，进而和下层 API 交互
NodeAPI层：为上层模块提供系统调用，通常是由 C 语言来实现，和操做系统进行交互。
LIBUV层：是跨平台的底层封装，实现了事件循环、文件操做等，是 Node.js 实现异步的核心。

不管是 Linux 平台仍是 Windows 平台，Node.js 内部都是经过线程池来完成异步 I/O 操做的，而 LIBUV 针对不一样平台的差别性实现了统一调用。所以，Node.js 的单线程仅仅是指 JavaScript 运行在单线程中，而并不是 Node.js 是单线程。

三、事件驱动模型

Node.js 实现异步的核心是事件驱动，也就是说，它把每个任务都当成事件来处理，而后经过 Event Loop 模拟了异步的效果，为了更具体、更清晰的理解和接受这个事实，下面咱们用伪代码来描述一下这个实现过程。

【1】定义事件队列

既然是队列，那就是一个先进先出 (FIFO) 的数据结构，咱们用JS数组来描述，以下：

 
          /** 
         
          * 定义事件队列 
         
          * 入队：push() 
         
          * 出队：shift() 
         
          * 空队列：length == 0 
         
          */ 
         
          globalEventQueue: []

咱们利用数组来模拟队列结构：数组的第一个元素是队列的头部，数组的最后一个元素是队列的尾部，push() 就是在队列尾部插入一个元素，shift() 就是从队列头部弹出一个元素。这样就实现了一个简单的事件队列。

【2】定义接收请求入口

每个请求都会被拦截并进入处理函数，以下所示：

 
          /** 
         
          * 接收用户请求 
         
          * 每个请求都会进入到该函数 
         
          * 传递参数request和response 
         
          */ 
         
          processHttpRequest:function(request,response){ 
         
          //定义一个事件对象 
         
          var  
          event  
          = createEvent({ 
         
          params 
          :request. 
          params 
          ,  
          //传递请求参数 
         
          result: 
          null 
          ,  
          //存放请求结果 
         
          callback:function(){}  
          //指定回调函数 
         
          }); 
         
          //在队列的尾部添加该事件   
         
          globalEventQueue.push( 
          event 
          ); 
         
          }

这个函数很简单，就是把用户的请求包装成事件，放到队列里，而后继续接收其余请求。

【3】定义 Event Loop

当主线程处于空闲时就开始循环事件队列，因此咱们还要定义一个函数来循环事件队列：

 
          /** 
         
          * 事件循环主体，主线程择机执行 
         
          * 循环遍历事件队列 
         
          * 处理非IO任务 
         
          * 处理IO任务 
         
          * 执行回调，返回给上层 
         
          */ 
         
          eventLoop:function(){ 
         
          //若是队列不为空，就继续循环 
         
          while 
          ( 
          this 
          .globalEventQueue.length > 0){ 
         
          //从队列的头部拿出一个事件 
         
          var  
          event  
          =  
          this 
          .globalEventQueue.shift(); 
         
          //若是是耗时任务 
         
          if 
          (isIOTask( 
          event 
          )){ 
         
          //从线程池里拿出一个线程 
         
          var  
          thread = getThreadFromThreadPool(); 
         
          //交给线程处理 
         
          thread.handleIOTask( 
          event 
          ) 
         
          } 
          else  
          { 
         
          //非耗时任务处理后，直接返回结果 
         
          var  
          result = handleEvent( 
          event 
          ); 
         
          //最终经过回调函数返回给V8，再由V8返回给应用程序 
         
          event 
          .callback.call( 
          null 
          ,result); 
         
          } 
         
          } 
         
          }

主线程不停的检测事件队列，对于 I/O 任务，就交给线程池来处理，非 I/O 任务就本身处理并返回。

【4】处理 I/O 任务

线程池接到任务之后，直接处理IO操做，好比读取数据库：

 
          /** 
         
          * 处理IO任务 
         
          * 完成后将事件添加到队列尾部 
         
          * 释放线程 
         
          */ 
         
          handleIOTask:function( 
          event 
          ){ 
         
          //当前线程 
         
          var  
          curThread =  
          this 
          ; 
         
          //操做数据库 
         
          var  
          optDatabase = function( 
          params 
          ,callback){ 
         
          var  
          result = readDataFromDb( 
          params 
          ); 
         
          callback.call( 
          null 
          ,result) 
         
          }; 
         
          //执行IO任务 
         
          optDatabase( 
          event 
          . 
          params 
          ,function(result){ 
         
          //返回结果存入事件对象中 
         
          event 
          .result = result; 
         
          //IO完成后，将再也不是耗时任务 
         
          event 
          .isIOTask =  
          false 
          ; 
         
          //将该事件从新添加到队列的尾部 
         
          this 
          .globalEventQueue.push( 
          event 
          ); 
         
          //释放当前线程 
         
          releaseThread(curThread) 
         
          }) 
         
          }

当 I/O 任务完成之后就执行回调，把请求结果存入事件中，并将该事件从新放入队列中，等待循环，最后释放当前线程，当主线程再次循环到该事件时，就直接处理了。

总结以上过程咱们发现，Node.js 只用了一个主线程来接收请求，但它接收请求之后并无直接作处理，而是放到了事件队列中，而后又去接收其余请求了，空闲的时候，再经过 Event Loop 来处理这些事件，从而实现了异步效果，固然对于IO类任务还须要依赖于系统层面的线程池来处理。

所以，咱们能够简单的理解为：Node.js 自己是一个多线程平台，而它对 JavaScript 层面的任务处理是单线程的。

四、CPU密集型是短板

至此，对于 Node.js 的单线程模型，咱们应该有了一个简单而又清晰的认识，它经过事件驱动模型实现了高并发和异步 I/O，然而也有 Node.js 不擅长作的事情：

上面提到，若是是 I/O 任务，Node.js 就把任务交给线程池来异步处理，高效简单，所以 Node.js 适合处理I/O密集型任务。但不是全部的任务都是 I/O 密集型任务，当碰到CPU密集型任务时，即只用CPU计算的操做，好比要对数据加解密(node.bcrypt.js)，数据压缩和解压(node-tar)，这时 Node.js 就会亲自处理，一个一个的计算，前面的任务没有执行完，后面的任务就只能干等着。以下图所示：

在事件队列中，若是前面的 CPU 计算任务没有完成，后面的任务就会被阻塞，出现响应缓慢的状况，若是操做系统自己就是单核，那也就算了，但如今大部分服务器都是多 CPU 或多核的，而 Node.js 只有一个 EventLoop，也就是只占用一个 CPU 内核，当 Node.js 被CPU 密集型任务占用，致使其余任务被阻塞时，却还有 CPU 内核处于闲置状态，形成资源浪费。

所以，Node.js 并不适合 CPU 密集型任务。

五、适用场景

RESTful API: 请求和响应只需少许文本，而且不须要大量逻辑处理，所以能够并发处理数万条链接。
聊天服务: 轻量级、高流量，没有复杂的计算逻辑。