什么是 Event Loop?

Event Loop 是一个很重要的概念,指的是计算机系统的一种运行机制。javascript

JavaScript语言就采用这种机制,来解决单线程运行带来的一些问题。html

Event Loop

本文参考C. Aaron Cois的《Understanding The Node.js Event Loop》,解释什么是Event Loop,以及它与JavaScript语言的单线程模型有何关系。java

想要理解Event Loop,就要从程序的运行模式讲起。运行之后的程序叫作"进程"(process),通常状况下,一个进程一次只能执行一个任务。node

若是有不少任务须要执行,不外乎三种解决方法。git

(1)排队。由于一个进程一次只能执行一个任务,只好等前面的任务执行完了,再执行后面的任务。github

(2)新建进程。使用fork命令,为每一个任务新建一个进程。vim

(3)新建线程。由于进程太耗费资源,因此现在的程序每每容许一个进程包含多个线程,由线程去完成任务。(进程和线程的详细解释,请看这里。)api

以JavaScript语言为例,它是一种单线程语言,全部任务都在一个线程上完成,即采用上面的第一种方法。一旦遇到大量任务或者遇到一个耗时的任务,网页就会出现"假死",由于JavaScript停不下来,也就没法响应用户的行为。浏览器

你也许会问,JavaScript为何是单线程,难道不能实现为多线程吗?服务器

这跟历史有关系。JavaScript从诞生起就是单线程。缘由大概是不想让浏览器变得太复杂,由于多线程须要共享资源、且有可能修改彼此的运行结果,对于一种网页脚本语言来讲,这就太复杂了。后来就约定俗成,JavaScript为一种单线程语言。(Worker API能够实现多线程,可是JavaScript自己始终是单线程的。)

若是某个任务很耗时,好比涉及不少I/O(输入/输出)操做,那么线程的运行大概是下面的样子。

synchronous mode

上图的绿色部分是程序的运行时间,红色部分是等待时间。能够看到,因为I/O操做很慢,因此这个线程的大部分运行时间都在空等I/O操做的返回结果。这种运行方式称为"同步模式"(synchronous I/O)或"堵塞模式"(blocking I/O)。

若是采用多线程,同时运行多个任务,那极可能就是下面这样。

synchronous mode

上图代表,多线程不只占用多倍的系统资源,也闲置多倍的资源,这显然不合理。

Event Loop就是为了解决这个问题而提出的。Wikipedia这样定义:

"Event Loop是一个程序结构,用于等待和发送消息和事件。(a programming construct that waits for and dispatches events or messages in a program.)"

简单说,就是在程序中设置两个线程:一个负责程序自己的运行,称为"主线程";另外一个负责主线程与其余进程(主要是各类I/O操做)的通讯,被称为"Event Loop线程"(能够译为"消息线程")。

asynchronous mode

上图主线程的绿色部分,仍是表示运行时间,而橙色部分表示空闲时间。每当遇到I/O的时候,主线程就让Event Loop线程去通知相应的I/O程序,而后接着日后运行,因此不存在红色的等待时间。等到I/O程序完成操做,Event Loop线程再把结果返回主线程。主线程就调用事先设定的回调函数,完成整个任务。

能够看到,因为多出了橙色的空闲时间,因此主线程得以运行更多的任务,这就提升了效率。这种运行方式称为"异步模式"(asynchronous I/O)或"非堵塞模式"(non-blocking mode)。

这正是JavaScript语言的运行方式。单线程模型虽然对JavaScript构成了很大的限制,但也所以使它具有了其余语言不具有的优点。若是部署得好,JavaScript程序是不会出现堵塞的,这就是为何node.js平台能够用不多的资源,应付大流量访问的缘由。

(完)

 

 

 

 

 

 

1、为何JavaScript是单线程?

JavaScript语言的一大特色就是单线程,也就是说,同一个时间只能作一件事。那么,为何JavaScript不能有多个线程呢?这样能提升效率啊。

JavaScript的单线程,与它的用途有关。做为浏览器脚本语言,JavaScript的主要用途是与用户互动,以及操做DOM。这决定了它只能是单线程,不然会带来很复杂的同步问题。好比,假定JavaScript同时有两个线程,一个线程在某个DOM节点上添加内容,另外一个线程删除了这个节点,这时浏览器应该以哪一个线程为准?

因此,为了不复杂性,从一诞生,JavaScript就是单线程,这已经成了这门语言的核心特征,未来也不会改变。

为了利用多核CPU的计算能力,HTML5提出Web Worker标准,容许JavaScript脚本建立多个线程,可是子线程彻底受主线程控制,且不得操做DOM。因此,这个新标准并无改变JavaScript单线程的本质。

2、任务队列

单线程就意味着,全部任务须要排队,前一个任务结束,才会执行后一个任务。若是前一个任务耗时很长,后一个任务就不得不一直等着。

若是排队是由于计算量大,CPU忙不过来,倒也算了,可是不少时候CPU是闲着的,由于IO设备(输入输出设备)很慢(好比Ajax操做从网络读取数据),不得不等着结果出来,再往下执行。

JavaScript语言的设计者意识到,这时主线程彻底能够无论IO设备,挂起处于等待中的任务,先运行排在后面的任务。等到IO设备返回告终果,再回过头,把挂起的任务继续执行下去。

因而,全部任务能够分红两种,一种是同步任务(synchronous),另外一种是异步任务(asynchronous)。同步任务指的是,在主线程上排队执行的任务,只有前一个任务执行完毕,才能执行后一个任务;异步任务指的是,不进入主线程、而进入"任务队列"(task queue)的任务,只有"任务队列"通知主线程,某个异步任务能够执行了,该任务才会进入主线程执行。

具体来讲,异步执行的运行机制以下。(同步执行也是如此,由于它能够被视为没有异步任务的异步执行。)

(1)全部同步任务都在主线程上执行,造成一个执行栈(execution context stack)。

(2)主线程以外,还存在一个"任务队列"(task queue)。只要异步任务有了运行结果,就在"任务队列"之中放置一个事件。

(3)一旦"执行栈"中的全部同步任务执行完毕,系统就会读取"任务队列",看看里面有哪些事件。那些对应的异步任务,因而结束等待状态,进入执行栈,开始执行。

(4)主线程不断重复上面的第三步。

下图就是主线程和任务队列的示意图。

任务队列

只要主线程空了,就会去读取"任务队列",这就是JavaScript的运行机制。这个过程会不断重复。

3、事件和回调函数

"任务队列"是一个事件的队列(也能够理解成消息的队列),IO设备完成一项任务,就在"任务队列"中添加一个事件,表示相关的异步任务能够进入"执行栈"了。主线程读取"任务队列",就是读取里面有哪些事件。

"任务队列"中的事件,除了IO设备的事件之外,还包括一些用户产生的事件(好比鼠标点击、页面滚动等等)。只要指定过回调函数,这些事件发生时就会进入"任务队列",等待主线程读取。

所谓"回调函数"(callback),就是那些会被主线程挂起来的代码。异步任务必须指定回调函数,当主线程开始执行异步任务,就是执行对应的回调函数。

"任务队列"是一个先进先出的数据结构,排在前面的事件,优先被主线程读取。主线程的读取过程基本上是自动的,只要执行栈一清空,"任务队列"上第一位的事件就自动进入主线程。可是,因为存在后文提到的"定时器"功能,主线程首先要检查一下执行时间,某些事件只有到了规定的时间,才能返回主线程。

4、Event Loop

主线程从"任务队列"中读取事件,这个过程是循环不断的,因此整个的这种运行机制又称为Event Loop(事件循环)。

为了更好地理解Event Loop,请看下图(转引自Philip Roberts的演讲《Help, I'm stuck in an event-loop》)。

Event Loop

上图中,主线程运行的时候,产生堆(heap)和栈(stack),栈中的代码调用各类外部API,它们在"任务队列"中加入各类事件(click,load,done)。只要栈中的代码执行完毕,主线程就会去读取"任务队列",依次执行那些事件所对应的回调函数。

执行栈中的代码(同步任务),老是在读取"任务队列"(异步任务)以前执行。请看下面这个例子。

var req = new XMLHttpRequest(); req.open('GET', url); req.onload = function (){}; req.onerror = function (){}; req.send(); 

上面代码中的req.send方法是Ajax操做向服务器发送数据,它是一个异步任务,意味着只有当前脚本的全部代码执行完,系统才会去读取"任务队列"。因此,它与下面的写法等价。

var req = new XMLHttpRequest(); req.open('GET', url); req.send(); req.onload = function (){}; req.onerror = function (){}; 

也就是说,指定回调函数的部分(onload和onerror),在send()方法的前面或后面可有可无,由于它们属于执行栈的一部分,系统老是执行完它们,才会去读取"任务队列"。

5、定时器

除了放置异步任务的事件,"任务队列"还能够放置定时事件,即指定某些代码在多少时间以后执行。这叫作"定时器"(timer)功能,也就是定时执行的代码。

定时器功能主要由setTimeout()和setInterval()这两个函数来完成,它们的内部运行机制彻底同样,区别在于前者指定的代码是一次性执行,后者则为反复执行。如下主要讨论setTimeout()。

setTimeout()接受两个参数,第一个是回调函数,第二个是推迟执行的毫秒数。

console.log(1); setTimeout(function(){console.log(2);},1000); console.log(3); 

上面代码的执行结果是1,3,2,由于setTimeout()将第二行推迟到1000毫秒以后执行。

若是将setTimeout()的第二个参数设为0,就表示当前代码执行完(执行栈清空)之后,当即执行(0毫秒间隔)指定的回调函数。

setTimeout(function(){console.log(1);}, 0); console.log(2); 

上面代码的执行结果老是2,1,由于只有在执行完第二行之后,系统才会去执行"任务队列"中的回调函数。

总之,setTimeout(fn,0)的含义是,指定某个任务在主线程最先可得的空闲时间执行,也就是说,尽量早得执行。它在"任务队列"的尾部添加一个事件,所以要等到同步任务和"任务队列"现有的事件都处理完,才会获得执行。

HTML5标准规定了setTimeout()的第二个参数的最小值(最短间隔),不得低于4毫秒,若是低于这个值,就会自动增长。在此以前,老版本的浏览器都将最短间隔设为10毫秒。另外,对于那些DOM的变更(尤为是涉及页面从新渲染的部分),一般不会当即执行,而是每16毫秒执行一次。这时使用requestAnimationFrame()的效果要好于setTimeout()。

须要注意的是,setTimeout()只是将事件插入了"任务队列",必须等到当前代码(执行栈)执行完,主线程才会去执行它指定的回调函数。要是当前代码耗时很长,有可能要等好久,因此并无办法保证,回调函数必定会在setTimeout()指定的时间执行。

6、Node.js的Event Loop

Node.js也是单线程的Event Loop,可是它的运行机制不一样于浏览器环境。

请看下面的示意图(做者@BusyRich)。

Node.js

根据上图,Node.js的运行机制以下。

(1)V8引擎解析JavaScript脚本。

(2)解析后的代码,调用Node API。

(3)libuv库负责Node API的执行。它将不一样的任务分配给不一样的线程,造成一个Event Loop(事件循环),以异步的方式将任务的执行结果返回给V8引擎。

(4)V8引擎再将结果返回给用户。

除了setTimeout和setInterval这两个方法,Node.js还提供了另外两个与"任务队列"有关的方法:process.nextTicksetImmediate。它们能够帮助咱们加深对"任务队列"的理解。

process.nextTick方法能够在当前"执行栈"的尾部----下一次Event Loop(主线程读取"任务队列")以前----触发回调函数。也就是说,它指定的任务老是发生在全部异步任务以前。setImmediate方法则是在当前"任务队列"的尾部添加事件,也就是说,它指定的任务老是在下一次Event Loop时执行,这与setTimeout(fn, 0)很像。请看下面的例子(via StackOverflow)。

process.nextTick(function A() { console.log(1); process.nextTick(function B(){console.log(2);}); }); setTimeout(function timeout() { console.log('TIMEOUT FIRED'); }, 0) // 1 // 2 // TIMEOUT FIRED 

上面代码中,因为process.nextTick方法指定的回调函数,老是在当前"执行栈"的尾部触发,因此不只函数A比setTimeout指定的回调函数timeout先执行,并且函数B也比timeout先执行。这说明,若是有多个process.nextTick语句(无论它们是否嵌套),将所有在当前"执行栈"执行。

如今,再看setImmediate。

setImmediate(function A() { console.log(1); setImmediate(function B(){console.log(2);}); }); setTimeout(function timeout() { console.log('TIMEOUT FIRED'); }, 0); 

上面代码中,setImmediate与setTimeout(fn,0)各自添加了一个回调函数A和timeout,都是在下一次Event Loop触发。那么,哪一个回调函数先执行呢?答案是不肯定。运行结果多是1--TIMEOUT FIRED--2,也多是TIMEOUT FIRED--1--2。

使人困惑的是,Node.js文档中称,setImmediate指定的回调函数,老是排在setTimeout前面。实际上,这种状况只发生在递归调用的时候。

setImmediate(function (){ setImmediate(function A() { console.log(1); setImmediate(function B(){console.log(2);}); }); setTimeout(function timeout() { console.log('TIMEOUT FIRED'); }, 0); }); // 1 // TIMEOUT FIRED // 2 

上面代码中,setImmediate和setTimeout被封装在一个setImmediate里面,它的运行结果老是1--TIMEOUT FIRED--2,这时函数A必定在timeout前面触发。至于2排在TIMEOUT FIRED的后面(即函数B在timeout后面触发),是由于setImmediate老是将事件注册到下一轮Event Loop,因此函数A和timeout是在同一轮Loop执行,而函数B在下一轮Loop执行。

咱们由此获得了process.nextTick和setImmediate的一个重要区别:多个process.nextTick语句老是在当前"执行栈"一次执行完,多个setImmediate可能则须要屡次loop才能执行完。事实上,这正是Node.js 10.0版添加setImmediate方法的缘由,不然像下面这样的递归调用process.nextTick,将会没完没了,主线程根本不会去读取"事件队列"!

process.nextTick(function foo() { process.nextTick(foo); }); 

事实上,如今要是你写出递归的process.nextTick,Node.js会抛出一个警告,要求你改为setImmediate。

另外,因为process.nextTick指定的回调函数是在本次"事件循环"触发,而setImmediate指定的是在下次"事件循环"触发,因此很显然,前者老是比后者发生得早,并且执行效率也高(由于不用检查"任务队列")。

(完)

相关文章
相关标签/搜索