看法有限,若有描述不当之处,请帮忙及时指出,若有错误,会及时修正。css
----------超长文+多图预警,须要花费很多时间。----------html
若是看完本文后,还对进程线程傻傻分不清,不清楚浏览器多进程、浏览器内核多线程、JS单线程、JS运行机制的区别。那么请回复我,必定是我写的还不够清晰,我来改。。。前端
----------正文开始----------vue
最近发现有很多介绍JS单线程运行机制的文章,可是发现不少都仅仅是介绍某一部分的知识,并且各个地方的说法还不统一,容易形成困惑。
所以准备梳理这块知识点,结合已有的认知,基于网上的大量参考资料,
从浏览器多进程到JS单线程,将JS引擎的运行机制系统的梳理一遍。node
展示形式:因为是属于系统梳理型,就没有由浅入深了,而是从头至尾的梳理知识体系,
重点是将关键节点的知识点串联起来,而不是仅仅剖析某一部分知识。git
内容是:从浏览器进程,再到浏览器内核运行,再到JS引擎单线程,再到JS事件循环机制,从头至尾系统的梳理一遍,摆脱碎片化,造成一个知识体系github
目标是:看完这篇文章后,对浏览器多进程,JS单线程,JS事件循环机制这些都能有必定理解,
有一个知识体系骨架,而不是似懂非懂的感受。web
另外,本文适合有必定经验的前端人员,新手请规避,避免受到过多的概念冲击。能够先存起来,有了必定理解后再看,也能够分红多批次观看,避免过分疲劳。ajax
浏览器是多进程的canvas
梳理浏览器内核中线程之间的关系
简单梳理下浏览器渲染流程
从Event Loop谈JS的运行机制
线程和进程区分不清,是不少新手都会犯的错误,没有关系。这很正常。先看看下面这个形象的比喻:
- 进程是一个工厂,工厂有它的独立资源 - 工厂之间相互独立 - 线程是工厂中的工人,多个工人协做完成任务 - 工厂内有一个或多个工人 - 工人之间共享空间
再完善完善概念:
- 工厂的资源 -> 系统分配的内存(独立的一块内存) - 工厂之间的相互独立 -> 进程之间相互独立 - 多个工人协做完成任务 -> 多个线程在进程中协做完成任务 - 工厂内有一个或多个工人 -> 一个进程由一个或多个线程组成 - 工人之间共享空间 -> 同一进程下的各个线程之间共享程序的内存空间(包括代码段、数据集、堆等)
而后再巩固下:
若是是windows电脑中,能够打开任务管理器,能够看到有一个后台进程列表。对,那里就是查看进程的地方,并且能够看到每一个进程的内存资源信息以及cpu占有率。
因此,应该更容易理解了:进程是cpu资源分配的最小单位(系统会给它分配内存)
最后,再用较为官方的术语描述一遍:
tips
理解了进程与线程了区别后,接下来对浏览器进行必定程度上的认识:(先看下简化理解)
关于以上几点的验证,请再第一张图:
图中打开了Chrome
浏览器的多个标签页,而后能够在Chrome的任务管理器
中看到有多个进程(分别是每个Tab页面有一个独立的进程,以及一个主进程)。
感兴趣的能够自行尝试下,若是再多打开一个Tab页,进程正常会+1以上
注意:在这里浏览器应该也有本身的优化机制,有时候打开多个tab页后,能够在Chrome任务管理器中看到,有些进程被合并了
(因此每个Tab标签对应一个进程并不必定是绝对的)
知道了浏览器是多进程后,再来看看它到底包含哪些进程:(为了简化理解,仅列举主要进程)
Browser进程:浏览器的主进程(负责协调、主控),只有一个。做用有
浏览器渲染进程(浏览器内核)(Renderer进程,内部是多线程的):默认每一个Tab页面一个进程,互不影响。主要做用为
强化记忆:在浏览器中打开一个网页至关于新起了一个进程(进程内有本身的多线程)
固然,浏览器有时会将多个进程合并(譬如打开多个空白标签页后,会发现多个空白标签页被合并成了一个进程),如图
另外,能够经过Chrome的更多工具 -> 任务管理器
自行验证
相比于单进程浏览器,多进程有以下优势:
简单点理解:若是浏览器是单进程,那么某个Tab页崩溃了,就影响了整个浏览器,体验有多差;同理若是是单进程,插件崩溃了也会影响整个浏览器;并且多进程还有其它的诸多优点。。。
固然,内存等资源消耗也会更大,有点空间换时间的意思。
重点来了,咱们能够看到,上面提到了这么多的进程,那么,对于普通的前端操做来讲,最终要的是什么呢?答案是渲染进程
能够这样理解,页面的渲染,JS的执行,事件的循环,都在这个进程内进行。接下来重点分析这个进程
请牢记,浏览器的渲染进程是多线程的(这点若是不理解,请回头看进程和线程的区分)
终于到了线程这个概念了?,好亲切。那么接下来看看它都包含了哪些线程(列举一些主要常驻线程):
GUI渲染线程
JS引擎线程
事件触发线程
注意,因为JS的单线程关系,因此这些待处理队列中的事件都得排队等待JS引擎处理(当JS引擎空闲时才会去执行)
定时触发器线程
setInterval
与setTimeout
所在线程异步http请求线程
看到这里,若是以为累了,能够先休息下,这些概念须要被消化,毕竟后续将提到的事件循环机制就是基于事件触发线程
的,因此若是仅仅是看某个碎片化知识,
可能会有一种似懂非懂的感受。要完成的梳理一遍才能快速沉淀,不易遗忘。放张图巩固下吧:
再说一点,为何JS引擎是单线程的?额,这个问题其实应该没有标准答案,譬如,可能仅仅是由于因为多线程的复杂性,譬如多线程操做通常要加锁,所以最初设计时选择了单线程。。。
看到这里,首先,应该对浏览器内的进程和线程都有必定理解了,那么接下来,再谈谈浏览器的Browser进程(控制进程)是如何和内核通讯的,
这点也理解后,就能够将这部分的知识串联起来,从头至尾有一个完整的概念。
若是本身打开任务管理器,而后打开一个浏览器,就能够看到:任务管理器中出现了两个进程(一个是主控进程,一个则是打开Tab页的渲染进程),
而后在这前提下,看下整个的过程:(简化了不少)
Renderer进程的Renderer接口收到消息,简单解释后,交给渲染线程,而后开始渲染
这里绘一张简单的图:(很简化)
看完这一整套流程,应该对浏览器的运做有了必定理解了,这样有了知识架构的基础后,后续就方便往上填充内容。
这块再往深处讲的话就涉及到浏览器内核源码解析了,不属于本文范围。
若是这一块要深挖,建议去读一些浏览器内核源码解析文章,或者能够先看看参考下来源中的第一篇文章,写的不错
到了这里,已经对浏览器的运行有了一个总体的概念,接下来,先简单梳理一些概念
因为JavaScript是可操纵DOM的,若是在修改这些元素属性同时渲染界面(即JS线程和UI线程同时运行),那么渲染线程先后得到的元素数据就可能不一致了。
所以为了防止渲染出现不可预期的结果,浏览器设置GUI渲染线程与JS引擎为互斥的关系,当JS引擎执行时GUI线程会被挂起,
GUI更新则会被保存在一个队列中等到JS引擎线程空闲时当即被执行。
从上述的互斥关系,能够推导出,JS若是执行时间过长就会阻塞页面。
譬如,假设JS引擎正在进行巨量的计算,此时就算GUI有更新,也会被保存到队列中,等待JS引擎空闲后执行。
而后,因为巨量计算,因此JS引擎极可能好久好久后才能空闲,天然会感受到巨卡无比。
因此,要尽可能避免JS执行时间过长,这样就会形成页面的渲染不连贯,致使页面渲染加载阻塞的感受。
前文中有提到JS引擎是单线程的,并且JS执行时间过长会阻塞页面,那么JS就真的对cpu密集型计算无能为力么?
因此,后来HTML5中支持了Web Worker
。
MDN的官方解释是:
Web Worker为Web内容在后台线程中运行脚本提供了一种简单的方法。线程能够执行任务而不干扰用户界面 一个worker是使用一个构造函数建立的一个对象(e.g. Worker()) 运行一个命名的JavaScript文件 这个文件包含将在工做线程中运行的代码; workers 运行在另外一个全局上下文中,不一样于当前的window 所以,使用 window快捷方式获取当前全局的范围 (而不是self) 在一个 Worker 内将返回错误
这样理解下:
因此,若是有很是耗时的工做,请单独开一个Worker线程,这样里面无论如何翻天覆地都不会影响JS引擎主线程,
只待计算出结果后,将结果通讯给主线程便可,perfect!
并且注意下,JS引擎是单线程的,这一点的本质仍然未改变,Worker能够理解是浏览器给JS引擎开的外挂,专门用来解决那些大量计算问题。
其它,关于Worker的详解就不是本文的范畴了,所以再也不赘述。
既然都到了这里,就再提一下SharedWorker
(避免后续将这两个概念搞混)
WebWorker只属于某个页面,不会和其余页面的Render进程(浏览器内核进程)共享
SharedWorker是浏览器全部页面共享的,不能采用与Worker一样的方式实现,由于它不隶属于某个Render进程,能够为多个Render进程共享使用
看到这里,应该就很容易明白了,本质上就是进程和线程的区别。SharedWorker由独立的进程管理,WebWorker只是属于render进程下的一个线程
原本是直接计划开始谈JS运行机制的,但想了想,既然上述都一直在谈浏览器,直接跳到JS可能再突兀,所以,中间再补充下浏览器的渲染流程(简单版本)
为了简化理解,前期工做直接省略成:(要展开的或彻底能够写另外一篇超长文)
- 浏览器输入url,浏览器主进程接管,开一个下载线程, 而后进行 http请求(略去DNS查询,IP寻址等等操做),而后等待响应,获取内容, 随后将内容经过RendererHost接口转交给Renderer进程 - 浏览器渲染流程开始
浏览器器内核拿到内容后,渲染大概能够划分红如下几个步骤:
全部详细步骤都已经略去,渲染完毕后就是load
事件了,以后就是本身的JS逻辑处理了
既然略去了一些详细的步骤,那么就提一些可能须要注意的细节把。
这里重绘参考来源中的一张图:(参考来源第一篇)
上面提到,渲染完毕后会触发load
事件,那么你能分清楚load
事件与DOMContentLoaded
事件的前后么?
很简单,知道它们的定义就能够了:
(譬如若是有async加载的脚本就不必定完成)
(渲染完毕了)
因此,顺序是:DOMContentLoaded -> load
这里说的是头部引入css的状况
首先,咱们都知道:css是由单独的下载线程异步下载的。
而后再说下几个现象:
这可能也是浏览器的一种优化机制。
由于你加载css的时候,可能会修改下面DOM节点的样式,
若是css加载不阻塞render树渲染的话,那么当css加载完以后,
render树可能又得从新重绘或者回流了,这就形成了一些没有必要的损耗。
因此干脆就先把DOM树的结构先解析完,把能够作的工做作完,而后等你css加载完以后,
在根据最终的样式来渲染render树,这种作法性能方面确实会比较好一点。
渲染步骤中就提到了composite
概念。
能够简单的这样理解,浏览器渲染的图层通常包含两大类:普通图层
以及复合图层
首先,普通文档流内能够理解为一个复合图层(这里称为默认复合层
,里面无论添加多少元素,其实都是在同一个复合图层中)
其次,absolute布局(fixed也同样),虽然能够脱离普通文档流,但它仍然属于默认复合层
。
而后,能够经过硬件加速
的方式,声明一个新的复合图层
,它会单独分配资源
(固然也会脱离普通文档流,这样一来,无论这个复合图层中怎么变化,也不会影响默认复合层
里的回流重绘)
能够简单理解下:GPU中,各个复合图层是单独绘制的,因此互不影响,这也是为何某些场景硬件加速效果一级棒
能够Chrome源码调试 -> More Tools -> Rendering -> Layer borders
中看到,黄色的就是复合图层信息
以下图。能够验证上述的说法
如何变成复合图层(硬件加速)
将该元素变成一个复合图层,就是传说中的硬件加速技术
translate3d
、translateZ
opacity
属性/过渡动画(须要动画执行的过程当中才会建立合成层,动画没有开始或结束后元素还会回到以前的状态)will-chang
属性(这个比较偏僻),通常配合opacity与translate使用(并且经测试,除了上述能够引起硬件加速的属性外,其它属性并不会变成复合层),做用是提早告诉浏览器要变化,这样浏览器会开始作一些优化工做(这个最好用完后就释放)
<video><iframe><canvas><webgl>
等元素absolute和硬件加速的区别
能够看到,absolute虽然能够脱离普通文档流,可是没法脱离默认复合层。
因此,就算absolute中信息改变时不会改变普通文档流中render树,
可是,浏览器最终绘制时,是整个复合层绘制的,因此absolute中信息的改变,仍然会影响整个复合层的绘制。
(浏览器会重绘它,若是复合层中内容多,absolute带来的绘制信息变化过大,资源消耗是很是严重的)
而硬件加速直接就是在另外一个复合层了(另起炉灶),因此它的信息改变不会影响默认复合层
(固然了,内部确定会影响属于本身的复合层),仅仅是引起最后的合成(输出视图)
复合图层的做用?
通常一个元素开启硬件加速后会变成复合图层,能够独立于普通文档流中,改动后能够避免整个页面重绘,提高性能
可是尽可能不要大量使用复合图层,不然因为资源消耗过分,页面反而会变的更卡
硬件加速时请使用index
使用硬件加速时,尽量的使用index,防止浏览器默认给后续的元素建立复合层渲染
具体的原理时这样的:
**webkit CSS3中,若是这个元素添加了硬件加速,而且index层级比较低,
那么在这个元素的后面其它元素(层级比这个元素高的,或者相同的,而且releative或absolute属性相同的),
会默认变为复合层渲染,若是处理不当会极大的影响性能**
简单点理解,其实能够认为是一个隐式合成的概念:若是a是一个复合图层,并且b在a上面,那么b也会被隐式转为一个复合图层,这点须要特别注意
另外,这个问题能够在这个地址看到重现(原做者分析的挺到位的,直接上连接):
到此时,已是属于浏览器页面初次渲染完毕后的事情,JS引擎的一些运行机制分析。
注意,这里不谈可执行上下文
,VO
,scop chain
等概念(这些彻底能够整理成另外一篇文章了),这里主要是结合Event Loop
来谈JS代码是如何执行的。
读这部分的前提是已经知道了JS引擎是单线程,并且这里会用到上文中的几个概念:(若是不是很理解,能够回头温习)
而后再理解一个概念:
执行栈
任务队列
,只要异步任务有了运行结果,就在任务队列
之中放置一个事件。执行栈
中的全部同步任务执行完毕(此时JS引擎空闲),系统就会读取任务队列
,将可运行的异步任务添加到可执行栈中,开始执行。看图:
看到这里,应该就能够理解了:为何有时候setTimeout推入的事件不能准时执行?由于可能在它推入到事件列表时,主线程还不空闲,正在执行其它代码,
因此天然有偏差。
这里就直接引用一张图片来协助理解:(参考自Philip Roberts的演讲《Help, I'm stuck in an event-loop》)
上图大体描述就是:
栈中的代码调用某些api时,它们会在事件队列中添加各类事件(当知足触发条件后,如ajax请求完毕)
上述事件循环机制的核心是:JS引擎线程和事件触发线程
但事件上,里面还有一些隐藏细节,譬如调用setTimeout
后,是如何等待特定时间后才添加到事件队列中的?
是JS引擎检测的么?固然不是了。它是由定时器线程控制(由于JS引擎本身都忙不过来,根本无暇分身)
为何要单独的定时器线程?由于JavaScript引擎是单线程的, 若是处于阻塞线程状态就会影响记计时的准确,所以颇有必要单独开一个线程用来计时。
何时会用到定时器线程?当使用setTimeout
或setInterval
时,它须要定时器线程计时,计时完成后就会将特定的事件推入事件队列中。
譬如:
setTimeout(function(){ console.log('hello!'); }, 1000);
这段代码的做用是当1000
毫秒计时完毕后(由定时器线程计时),将回调函数推入事件队列中,等待主线程执行
setTimeout(function(){ console.log('hello!'); }, 0); console.log('begin');
这段代码的效果是最快的时间内将回调函数推入事件队列中,等待主线程执行
注意:
begin
后hello!
(不过也有一说是不一样浏览器有不一样的最小时间设定)
begin
(由于只有可执行栈内空了后才会主动读取事件队列)用setTimeout模拟按期计时和直接用setInterval是有区别的。
由于每次setTimeout计时到后就会去执行,而后执行一段时间后才会继续setTimeout,中间就多了偏差
(偏差多少与代码执行时间有关)
而setInterval则是每次都精确的隔一段时间推入一个事件
(可是,事件的实际执行时间不必定就准确,还有多是这个事件还没执行完毕,下一个事件就来了)
并且setInterval有一些比较致命的问题就是:
就会致使定时器代码连续运行好几回,而之间没有间隔。
就算正常间隔执行,多个setInterval的代码执行时间可能会比预期小(由于代码执行须要必定时间)
它会把setInterval的回调函数放在队列中,等浏览器窗口再次打开时,一瞬间所有执行时
因此,鉴于这么多但问题,目前通常认为的最佳方案是:用setTimeout模拟setInterval,或者特殊场合直接用requestAnimationFrame
补充:JS高程中有提到,JS引擎会对setInterval进行优化,若是当前事件队列中有setInterval的回调,不会重复添加。不过,仍然是有不少问题。。。
这段参考了参考来源中的第2篇文章(英文版的),(加了下本身的理解从新描述了下),
强烈推荐有英文基础的同窗直接观看原文,做者描述的很清晰,示例也很不错,以下:
https://jakearchibald.com/2015/tasks-microtasks-queues-and-schedules/
上文中将JS事件循环机制梳理了一遍,在ES5的状况是够用了,可是在ES6盛行的如今,仍然会遇到一些问题,譬以下面这题:
console.log('script start'); setTimeout(function() { console.log('setTimeout'); }, 0); Promise.resolve().then(function() { console.log('promise1'); }).then(function() { console.log('promise2'); }); console.log('script end');
嗯哼,它的正确执行顺序是这样子的:
script start script end promise1 promise2 setTimeout
为何呢?由于Promise里有了一个一个新的概念:microtask
或者,进一步,JS中分为两种任务类型:macrotask
和microtask
,在ECMAScript中,microtask称为jobs
,macrotask可称为task
它们的定义?区别?简单点能够按以下理解:
macrotask(又称之为宏任务),能够理解是每次执行栈执行的代码就是一个宏任务(包括每次从事件队列中获取一个事件回调并放到执行栈中执行)
(`task->渲染->task->...`)
microtask(又称为微任务),能够理解是在当前 task 执行结束后当即执行的任务
分别很么样的场景会造成macrotask和microtask呢?
__补充:在node环境下,process.nextTick的优先级高于Promise__,也就是能够简单理解为:在宏任务结束后会先执行微任务队列中的nextTickQueue部分,而后才会执行微任务中的Promise部分。
参考:https://segmentfault.com/q/1010000011914016
再根据线程来理解下:
(这点由本身理解+推测得出,由于它是在主线程下无缝执行的)
因此,总结下运行机制:
如图:
另外,请注意下Promise
的polyfill
与官方版本的区别:
注意,有一些浏览器执行结果不同(由于它们可能把microtask当成macrotask来执行了),
可是为了简单,这里不描述一些不标准的浏览器下的场景(但记住,有些浏览器可能并不标准)
20180126补充:使用MutationObserver实现microtask
MutationObserver能够用来实现microtask
(它属于microtask,优先级小于Promise,
通常是Promise不支持时才会这样作)
它是HTML5中的新特性,做用是:监听一个DOM变更,
当DOM对象树发生任何变更时,Mutation Observer会获得通知
像之前的Vue源码中就是利用它来模拟nextTick的,
具体原理是,建立一个TextNode并监听内容变化,
而后要nextTick的时候去改一下这个节点的文本内容,
以下:(Vue的源码,未修改)
var counter = 1 var observer = new MutationObserver(nextTickHandler) var textNode = document.createTextNode(String(counter)) observer.observe(textNode, { characterData: true }) timerFunc = () => { counter = (counter + 1) % 2 textNode.data = String(counter) }
不过,如今的Vue(2.5+)的nextTick实现移除了MutationObserver的方式(听说是兼容性缘由),
取而代之的是使用MessageChannel
(固然,默认状况仍然是Promise,不支持才兼容的)。
MessageChannel属于宏任务,优先级是:MessageChannel->setTimeout
,
因此Vue(2.5+)内部的nextTick与2.4及以前的实现是不同的,须要注意下。
这里不展开,能够看下http://www.javashuo.com/article/p-uvlubpli-gp.html
看到这里,不知道对JS的运行机制是否是更加理解了,从头至尾梳理,而不是就某一个碎片化知识应该是会更清晰的吧?
同时,也应该注意到了JS根本就没有想象的那么简单,前端的知识也是无穷无尽,层出不穷的概念、N多易忘的知识点、各式各样的框架、
底层原理方面也是能够无限的往下深挖,而后你就会发现,你知道的太少了。。。
另外,本文也打算先告一段落,其它的,如JS词法解析,可执行上下文以及VO等概念就不继续在本文中写了,后续能够考虑另开新的文章。
最后,喜欢的话,就请给个赞吧!
初次发布2018.01.21
于我我的博客上面
http://www.dailichun.com/2018/01/21/js_singlethread_eventloop.html