Webpack 源码(一)—— Tapable 和 事件流

一、Tapable

Tap 的英文单词解释,除了最经常使用的 点击 手势以外,还有一个意思是 水龙头 —— 在 webpack 中指的是后一种;html

Webpack 能够认为是一种基于事件流的编程范例,内部的工做流程都是基于 插件 机制串接起来;webpack

而将这些插件粘合起来的就是webpack本身写的基础类 Tapable 是,plugin方法就是该类暴露出来的;git

后面咱们将看到核心的对象 Compiler、Compilation 等都是继承于该对象

基于该类规范而其的 Webpack 体系保证了插件的有序性,使得整个系统很是有弹性,扩展性很好;然而有一个致命的缺点就是调试、看源码真是很痛苦,各类跳来跳去;(基于事件流的写法,和程序语言中的 goto 语句很相似)github

把这个仓库下载,使用 Webstorm 进行调试,test 目录是很好的教程入口;web

Tapable.plugin():至关于把对象归类到名为 name 的对象下,以array的形式;全部的插件都存在私有变量 _plugin 变量中;shell

plugins

接下来咱们简单节选几个函数分析一下:express

1.一、apply 方法

该方法最普通也是最经常使用的,看一下它的定义:编程

Tapable.prototype.apply = function apply() {
    for(var i = 0; i < arguments.length; i++) {
        arguments[i].apply(this);
    }
};

毫无悬念,就是 挨个顺序 执行传入到该函数方法中对象的 apply 方法;一般传入该函数的对象也是 Tapable 插件 对象,所以必然也存在 apply 方法;(Webpack 的插件就是Tapable对象,所以必需要提供 apply 方法 )bootstrap

只是更改上下文为当前 this微信

所以当前这里最大的做用就是传入当前 Tapable 的上下文

1.二、 applyPluginsAsync(name,...other,callback)

// 模拟两个插件
var _plugins = {
    "emit":[
        function(a,b,cb){
            setTimeout(()=>{
              console.log('1',a,b);
              cb();
            },1000);
        },
        function(a,b,cb){
            setTimeout(()=>{
                console.log('2',a,b);
                cb();
            },500)
        }
    ]
}

applyPluginsAsync("emit",'aaaa','bbbbb',function(){console.log('end')});

// 输出结果:

// 1 aaaa bbbbb
// 2 aaaa bbbbb
//  end

咱们看到,虽然第一个插件是延后 1000ms 执行,第二个则是延后 500ms,但在真正执行的时候,是严格按照顺序执行的;每一个插件须要在最后显式调用cb()通知下一个插件的运行;

这里须要注意每一个插件的形参的个数都要一致,且最后一个必须是cb()方法,用于唤起下一个插件的运行;cb的第一个参数是err,若是该参数不为空,就直接调用最后callback,中断后续插件的运行;

1.三、 applyPluginsParallel(name,...other,callback)

大部分代码和 applyPluginsAsync 有点儿相似

这个 applyPluginsParallel 主要功能和 最简单的 applyPlugins 方法比较类似,不管如何都会让全部注册的插件运行一遍

只是相比 applyPlugins 多了一个额外的功能,它最后 提供一个 callback 函数,这个 callback 的函数比较倔强,若是全部的插件x都正常执行,且最后都cb(),则会在最后执行callback里的逻辑;不过,一旦其中某个插件运行出错,就会调用这个callback(err),以后就算插件有错误也不会再调用该callback函数;

var _plugins = {
"emit":[
    function(a,b,cb){
        setTimeout(()=>{
          console.log('1',a,b);
          cb(null,'e222','33333');
        },1000);
    },
    function(a,b,cb){
        setTimeout(()=>{
            console.log('2',a,b);
            cb(null,'err');
        },500)
    }
]
}

applyPluginsParallel("emit",'aaaa','bbbbb',function(a,b){console.log('end',a,b)});

// 输出结果:

// 2 aaaa bbbbb
// 1 aaaa bbbbb
//  end undefined undefined

上面的两个插件都是调用了 cb,且第一个参数是 null(表示没有错误),因此最后能输出 callback 函数中的 console 内容;

若是注释两个插件中任何一个 cb() 调用,你会发现最后的 callback 没有执行

若是让 第二个 cb()的第一个值不是 null,好比 cb('err'),则 callback 以后输出这个错误,以后不再会调用此 callback:

var _plugins = {
"emit":[
    function(a,b,cb){
        setTimeout(()=>{
          console.log('1',a,b);
          cb('e222','33333');
        },1000);
    },
    function(a,b,cb){
        setTimeout(()=>{
            console.log('2',a,b);
            cb('err');
        },500)
    }
]
}

// 输出结果:

// 2 aaaa bbbbb
// end err undefined
// 1 aaaa bbbbb

1.四、 applyPluginsWaterfall(name, init, callback)

顾名思义,这个方法至关因而 瀑布式 调用,给第一个插件传入初始对象 init,而后通过第一个插件调用以后会得到一个结果对象,该结果对象会传给下一个插件 做为初始值,直到最后调用完毕,最后一个插件的直接结果传给 callback 做为初始值;

1.五、 applyPluginsParallelBailResult(name,...other,callback)

这个方法应该是全部方法中最难理解的;

首先它的行为和 applyPluginsParallel 很是类似,首先会 不管如何都会让全部注册的插件运行一遍(根据注册的顺序)

为了让 callback 执行,其前提条件是每一个插件都须要调用 cb();

但其中的 callback 只会执行一次(当传给cb的值不是undefined/null 的时候),这一次执行顺序是插件定义顺序有关,而跟每一个插件中的 cb() 执行时间无关的

var _plugins = {
"emit":[
    function(a,b,cb){
        setTimeout(()=>{
          console.log('1',a,b);
          cb();
        },1000);
    },
    function(a,b,cb){
        setTimeout(()=>{
            console.log('2',a,b);
            cb();
        },500)
    },
    function(a,b,cb){
        setTimeout(()=>{
            console.log('3',a,b);
            cb();
        },1500)
    }
]
}

applyPluginsParallelBailResult("emit",'aaaa','bbbbb',function(a,b){console.log('end',a,b)});

// 运行结果

// 2 aaaa bbbbb
// 1 aaaa bbbbb
// 3 aaaa bbbbb
// end undefined undefined

这是最普通的运行状况,咱们稍微调整一下(注意三个插件运行的顺序2-1-3),分别给cb传入有效的值:

var _plugins = {
"emit":[
    function(a,b,cb){
        setTimeout(()=>{
          console.log('1',a,b);
          cb('1');
        },1000);
    },
    function(a,b,cb){
        setTimeout(()=>{
            console.log('2',a,b);
            cb('2');
        },500)
    },
    function(a,b,cb){
        setTimeout(()=>{
            console.log('3',a,b);
            cb('3');
        },1500)
    }
]
}
applyPluginsParallelBailResult("emit",'aaaa','bbbbb',function(a,b){console.log('end',a,b)});
// 运行结果

// 2 aaaa bbbbb
// 1 aaaa bbbbb
// end 1 undefined
// 3 aaaa bbbbb

能够发现第1个插件 cb('1') 执行了,后续的 cb('2')cb('3') 都给忽略了;

这是由于插件注册顺序是 1-2-3,虽然运行的时候顺序是 2-1-3,但所运行的仍是 1 对应的 cb;因此,就算1执行的速度最慢(好比把其setTimeout的值设置成 2000),运行的 cb 仍然是1对应的cb;

其中涉及的魔法是 闭包,传入的 i就是和注册顺序绑定了

这样一说明,你会发现 applyPluginsParallel 的 cb 执行时机是和执行时间有关系的,你能够本身验证一下;

1.六、总结

总结一下,Tapable 就至关因而一个 事件管家,它所提供的 plugin 方法相似于 addEventListen 监听事件,apply 方法相似于事件触发函数 trigger

总结一下

二、Webpack 中的事件流

既然 Webpack 是基于 Tapable 搭建起来的,那么咱们看一下 Webpack 构建一个模块的基本事件流是如何的;

咱们在 Webpack 库中的 Tapable.js 中每一个方法中新增 console 语句打出日志,就能找出全部关键的事件名字:

log

打印结果:(这里只列举了简单的事件流程,打包不一样的入口文件会有所差别,但 事件出现的前后顺序是固定的

类型 名字 事件名
[C] applyPluginsBailResult entry-option
[A] applyPlugins after-plugins
[A] applyPlugins after-resolvers
[A] applyPlugins environment
[A] applyPlugins after-environment
[D] applyPluginsAsyncSeries run
[A] applyPlugins normal-module-factory
[A] applyPlugins context-module-factory
[A] applyPlugins compile
[A] applyPlugins this-compilation
[A] applyPlugins compilation
[F] applyPluginsParallel make
[E] applyPluginsAsyncWaterfall before-resolve
[B] applyPluginsWaterfall factory
[B] applyPluginsWaterfall resolver
[A] applyPlugins resolve
[A] applyPlugins resolve-step
[G] applyPluginsParallelBailResult file
[G] applyPluginsParallelBailResult directory
[A] applyPlugins resolve-step
[G] applyPluginsParallelBailResult result
[E] applyPluginsAsyncWaterfall after-resolve
[C] applyPluginsBailResult create-module
[B] applyPluginsWaterfall module
[A] applyPlugins build-module
[A] applyPlugins normal-module-loader
[C] applyPluginsBailResult program
[C] applyPluginsBailResult statement
[C] applyPluginsBailResult evaluate CallExpression
[C] applyPluginsBailResult var data
[C] applyPluginsBailResult evaluate Identifier
[C] applyPluginsBailResult evaluate Identifier require
[C] applyPluginsBailResult call require
[C] applyPluginsBailResult evaluate Literal
[C] applyPluginsBailResult call require:amd:array
[C] applyPluginsBailResult evaluate Literal
[C] applyPluginsBailResult call require:commonjs:item
[C] applyPluginsBailResult statement
[C] applyPluginsBailResult evaluate MemberExpression
[C] applyPluginsBailResult evaluate Identifier console.log
[C] applyPluginsBailResult call console.log
[C] applyPluginsBailResult expression console.log
[C] applyPluginsBailResult expression console
[A] applyPlugins succeed-module
[E] applyPluginsAsyncWaterfall before-resolve
[B] applyPluginsWaterfall factory
[A] applyPlugins build-module
[A] applyPlugins succeed-module
[A] applyPlugins seal
[A] applyPlugins optimize
[A] applyPlugins optimize-modules
[A] applyPlugins after-optimize-modules
[A] applyPlugins optimize-chunks
[A] applyPlugins after-optimize-chunks
[D] applyPluginsAsyncSeries optimize-tree
[A] applyPlugins after-optimize-tree
[C] applyPluginsBailResult should-record
[A] applyPlugins revive-modules
[A] applyPlugins optimize-module-order
[A] applyPlugins before-module-ids
[A] applyPlugins optimize-module-ids
[A] applyPlugins after-optimize-module-ids
[A] applyPlugins record-modules
[A] applyPlugins revive-chunks
[A] applyPlugins optimize-chunk-order
[A] applyPlugins before-chunk-ids
[A] applyPlugins optimize-chunk-ids
[A] applyPlugins after-optimize-chunk-ids
[A] applyPlugins record-chunks
[A] applyPlugins before-hash
[A] applyPlugins hash
[A] applyPlugins hash
[A] applyPlugins hash
[A] applyPlugins hash
[A] applyPlugins hash-for-chunk
[A] applyPlugins chunk-hash
[A] applyPlugins after-hash
[A] applyPlugins before-chunk-assets
[B] applyPluginsWaterfall global-hash-paths
[C] applyPluginsBailResult global-hash
[B] applyPluginsWaterfall bootstrap
[B] applyPluginsWaterfall local-vars
[B] applyPluginsWaterfall require
[B] applyPluginsWaterfall module-obj
[B] applyPluginsWaterfall module-require
[B] applyPluginsWaterfall require-extensions
[B] applyPluginsWaterfall asset-path
[B] applyPluginsWaterfall startup
[B] applyPluginsWaterfall module-require
[B] applyPluginsWaterfall render
[B] applyPluginsWaterfall module
[B] applyPluginsWaterfall render
[B] applyPluginsWaterfall package
[B] applyPluginsWaterfall module
[B] applyPluginsWaterfall render
[B] applyPluginsWaterfall package
[B] applyPluginsWaterfall modules
[B] applyPluginsWaterfall render-with-entry
[B] applyPluginsWaterfall asset-path
[B] applyPluginsWaterfall asset-path
[A] applyPlugins chunk-asset
[A] applyPlugins additional-chunk-assets
[A] applyPlugins record
[D] applyPluginsAsyncSeries additional-assets
[D] applyPluginsAsyncSeries optimize-chunk-assets
[A] applyPlugins after-optimize-chunk-assets
[D] applyPluginsAsyncSeries optimize-assets
[A] applyPlugins after-optimize-assets
[D] applyPluginsAsyncSeries after-compile
[C] applyPluginsBailResult should-emit
[D] applyPluginsAsyncSeries emit
[B] applyPluginsWaterfall asset-path
[D] applyPluginsAsyncSeries after-emit
[A] applyPlugins done

内容较多,依据源码内容的编排,能够将上述进行分层;大粒度的事件流以下:

大力度事件流

而其中 makesealemit 阶段比较核心(包含了不少小粒度的事件),后续会继续展开讲解;

这里罗列一下关键的事件节点:

  • entry-option:初始化options
  • run:开始编译
  • make:从entry开始递归的分析依赖,对每一个依赖模块进行build
  • before-resolve - after-resolve: 对其中一个模块位置进行解析
  • build-module :开始构建 (build) 这个module,这里将使用文件对应的loader加载
  • normal-module-loader:对用loader加载完成的module(是一段js代码)进行编译,用 acorn 编译,生成ast抽象语法树。
  • program: 开始对ast进行遍历,当遇到require等一些调用表达式时,触发 call require 事件的handler执行,收集依赖,并。如:AMDRequireDependenciesBlockParserPlugin等
  • seal: 全部依赖build完成,下面将开始对chunk进行优化,好比合并,抽取公共模块,加hash
  • optimize-chunk-assets:压缩代码,插件 UglifyJsPlugin 就放在这个阶段
  • bootstrap: 生成启动代码
  • emit: 把各个chunk输出到结果文件

三、参考文章

本系列的源码阅读,如下几篇文章给了不少启发和思路,其中 webpack 源码解析细说 webpack 之流程篇 尤其突出,推荐阅读;

下面的是个人公众号二维码图片,欢迎关注。
我的微信公众号

相关文章
相关标签/搜索