Webpack 实现 Tree shaking 的前世此生

掘金引流终版.gif

构建专栏系列目录入口css

左琳,微医前端技术部前端开发工程师。身处互联网浪潮之中,热爱生活与技术。前端

前言

若是看过 rollup 系列的这篇文章 - 无用代码去哪了?项目减重之 rollup 的 Tree-shaking,那你必定对 tree-shaking 不陌生了。若是对 tree-shaking 相关知识不熟悉,请先点开上面这篇文章花 5 分钟了解一下:什么是 tree-shaking。vue

众所周知,本来不支持 tree-shaking 的 Webpack 在它的 2.x 版本也实现了 tree-shaking,好奇心又来了,rollup 从一开始就自实现了 tree-shaking,而 Webpack 则是看到 rollup 的打包瘦身效果以后,到了 2.x 才实现,那么两者实现 tree-shaking 的原理是同样的吗?node

由于这样的疑问,就有了眼前这篇文章。react

Tree-shaking 实现机制

快速浏览完官方文档和一众文章后,发现 webpack 实现 tree-shaking 的方式还不止一种!可是,都与 rollup 不一样。webpack

早期 webpack 的配置使用并不简单,也所以曾有 webpack 配置工程师的戏称,虽然如今 webpack 的配置被极大简化了,webpack4 也宣称 0 配置,但若是涉及复杂全面的打包功能,并不是是 0 配置能够实现的。了解其功能原理及配置仍是极为有用的,接下来就来了解一下 webpack 实现 tree-shaking 的原理吧。 ​git

Tree-shaking -- rollup VS Webpack

  • rollup 是在编译打包过程当中分析程序流,得益于于 ES6 静态模块(exports 和 imports 不能在运行时修改),咱们在打包时就能够肯定哪些代码时咱们须要的。github

  • webpack 自己在打包时只能标记未使用的代码而不移除,而识别代码未使用标记并完成 tree-shaking 的 实际上是 UglifyJS、babili、terser 这类压缩代码的工具。简单来讲,就是压缩工具读取 webpack 打包结果,在压缩以前移除 bundle 中未使用的代码。web

咱们提到了标记未使用代码,也提到了 UglifyJS、babili、terser 等压缩工具,那么 webpack 与压缩工具是怎么实现 tree-shaking 的呢?先来了解下 webpack 中实现 tree-shaking 的前世此生吧! ​json

Webpack 实现 Tree-shaking 的 3 个阶段

第一阶段: UglifyJS

webpack 标记代码 + babel 转译 ES5 --> UglifyJS 压缩删除无用代码 ​ 关于最先版本的 Webpack 实现 tree-shaking 能够参考这篇文章 如何在 Webpack 2 中使用 tree-shaking,掘金也有翻译版,固然若是不肯意花时间考古,也能够看下面这一段总结:

  • UglifyJS 不支持 ES6 及以上,须要用 Babel 将代码编译为 ES5,而后再用 UglifyJS 来清除无用代码;
  • 经过 Babel 将代码编译为 ES5,但又要让 ES6 模块不受 Babel 预设(preset)的影响:配置 Babel 预设不转换 module,对应地配置 Webpack 的 plugins 配置;
  • 为避免反作用,将其标记为 pure(无反作用),以便 UglifyJS 可以处理,主要是 webpack 的编译过程阻止了对类进行 tree-shaking,它仅对函数起做用,后来经过支持将类编译后的赋值标记为 @__PURE__解决了这个问题。
// .babelrc
{
  "presets": [
    ["env", {
      "loose": true, // 宽松模式
      "modules": false // 不转换 module,保持 ES6 语法
    }]
  ]
}
复制代码
// webpack.config.js
module: {
  rules: [
    { test: /\.js$/, loader: 'babel-loader' }
  ]
},

plugins: [
  new webpack.LoaderOptionsPlugin({
    minimize: true,
    debug: false
  }),
  new webpack.optimize.UglifyJsPlugin({
    compress: {
      warnings: true
    },
    output: {
      comments: false
    },
    sourceMap: false
  })
]
复制代码

第二阶段:BabelMinify

webpack 标记代码 --> Babili(即 BabelMinify)压缩删除无用代码 ​ Babili 后来被重命名为 BabelMinify,是基于 Babel 的代码压缩工具,而 Babel 已经经过咱们的解析器 Babylon 理解了新语法,同时又在 babili 中集成了 UglifyJS 的压缩功能,本质上实现了和 UglifyJS 同样的功能,但使用 babili 插件又没必要再转译,而是直接压缩,使代码体积更小。

通常使用 Babili 替代 uglify 有 Babili 插件式和 babel-loader 预设两种方式。在官方文档最后有说明,Babel Minify 最适合针对最新的浏览器(具备完整的 ES6+ 支持),也能够与一般的 Babel es2015 预设一块儿使用,以首先向下编译代码。

在 webpack 中使用 babel-loader,而后再引入 minify 做为一个 preset 会比直接使用 BabelMinifyWebpackPlugin 插件(下一个就讲到)执行得更快。由于 babel-minify 处理的文件体积会更小。 ​

第三阶段: Terser

webpack 标记代码 --> Terser 压缩删除无用代码 (webpack5 已内置) ​ terser 是一个用于 ES6+ 的 JavaScript 解析器和 mangler/compressor 工具包。若是你看过这个 issue,就会知道放弃 uglify 而投向 terser 怀抱的人愈来愈多,其缘由也很清楚:

  • uglify 再也不进行维护且不支持 ES6+ 语法
  • webpack 默认内置配置了 terser 插件实现代码压缩

​ 关于反作用,从 webpack 4 正式版本扩展了未使用模块检测能力,经过 package.json 的 "sideEffects" 属性做为标记,向 compiler 提供提示,代表项目中的哪些文件是 "pure(纯正 ES2015 模块)",由此能够安全地删除文件中未使用的部分。

webpack4 的时候还要手动配置一下压缩插件,但最新的 webpack5 已经内置实现 tree-shaking 啦!在生产环境下无需配置便可实现 tree-shaking !

Webpack 的 Tree-shaking 流程

Webpack 标记代码

总的来讲,webpack 对代码进行标记,主要是对 import & export 语句标记为 3 类:

  • 全部 import 标记为 /* harmony import */
  • 全部被使用过的 export 标记为/* harmony export ([type]) */,其中 [type] 和 webpack 内部有关,多是 binding, immutable 等等
  • 没被使用过的 export 标记为/* unused harmony export [FuncName] */,其中 [FuncName] 为 export 的方法名称

首先咱们要知道,为了正常运行业务项目,Webpack 须要将开发者编写的业务代码以及支撑、调配这些业务代码的运行时一并打包到产物(bundle)中。 ​ 落到 Webpack 源码实现上,运行时的生成逻辑能够划分为打包阶段中的两个步骤:

  • 依赖收集:遍历代码模块并收集模块的特性依赖,从而肯定整个项目对 Webpack runtime 的依赖列表;
  • 生成:合并 runtime 的依赖列表,打包到最终输出的 bundle。

显然,对代码的语句标记就发生在依赖收集的过程当中。

在运行时环境标记全部 import:

const exportsType = module.getExportsType(
	chunkGraph.moduleGraph,
	originModule.buildMeta.strictHarmonyModule
);
runtimeRequirements.add(RuntimeGlobals.require);
const importContent = `/* harmony import */ ${optDeclaration}${importVar} = __webpack_require__(${moduleId});\n`;

// 动态导入语法分析
if (exportsType === "dynamic") {
	runtimeRequirements.add(RuntimeGlobals.compatGetDefaultExport);
	return [
		importContent, // 标记/* harmony import */
		`/* harmony import */ ${optDeclaration}${importVar}_default = /*#__PURE__*/${RuntimeGlobals.compatGetDefaultExport}(${importVar});\n` // 经过 /*#__PURE__*/ 注释能够告诉 webpack 一个函数调用是无反作用的
	]; // 返回 import 语句和 compat 语句
}
复制代码

在运行时环境标记全部被使用过的和未被使用的 export:

// 在运行时状态定义 property getters
  generate() {
		const { runtimeTemplate } = this.compilation;
		const fn = RuntimeGlobals.definePropertyGetters;
		return Template.asString([
			"// define getter functions for harmony exports",
			`${fn} = ${runtimeTemplate.basicFunction("exports, definition", [ `for(var key in definition) {`, Template.indent([ `if(${RuntimeGlobals.hasOwnProperty}(definition, key) && !${RuntimeGlobals.hasOwnProperty}(exports, key)) {`, Template.indent([ "Object.defineProperty(exports, key, { enumerable: true, get: definition[key] });" ]), "}" ]), "}" ])};`
		]);
	}
  
  // 输入为 generate 上下文
  getContent({ runtimeTemplate, runtimeRequirements }) {
		runtimeRequirements.add(RuntimeGlobals.exports);
		runtimeRequirements.add(RuntimeGlobals.definePropertyGetters);

		const unusedPart =
			this.unusedExports.size > 1
				? `/* unused harmony exports ${joinIterableWithComma( this.unusedExports )} */\n`
				: this.unusedExports.size > 0
				? `/* unused harmony export ${first(this.unusedExports)} */\n`
				: "";
		const definitions = [];
		for (const [key, value] of this.exportMap) {
			definitions.push(
				`\n/* harmony export */ ${JSON.stringify( key )}: ${runtimeTemplate.returningFunction(value)}`
			);
		}
		const definePart =
			this.exportMap.size > 0
				? `/* harmony export */ ${RuntimeGlobals.definePropertyGetters}(${ this.exportsArgument }, {${definitions.join(",")}\n/* harmony export */ });\n`
				: "";
		return `${definePart}${unusedPart}`; // 做为初始化代码包含的源代码
	}
}
复制代码

压缩清除大法

UglifyJS

以 UglifyJS 为例,UglifyJS 是一个 js 解释器、最小化器、压缩器、美化器工具集(parser, minifier, compressor or beautifier toolkit)。具体介绍能够查看下 UglifyJS 中文手册

若是不想浏览这么一大长篇文档,能够看干净利落、直指 tree-shaking 的压缩配置参数总结吧!

  • dead_code -- 移除没被引用的代码 // 是否是很眼熟!无用代码!
  • drop_debugger -- 移除 debugger
  • unused -- 干掉没有被引用的函数和变量。(除非设置"keep_assign",不然变量的简单直接赋值也不算被引用。)
  • toplevel -- 干掉顶层做用域中没有被引用的函数 ("funcs")和/或变量("vars") (默认是 false , true 的话即函数变量都干掉)
  • warnings -- 当删除没有用处的代码时,显示警告 // 还挺贴心有么有~
  • pure_getters -- 默认是 false. 若是你传入 true,UglifyJS 会假设对象属性的引用(例如 foo.bar 或 foo["bar"])没有函数反作用。
  • pure_funcs -- 默认 null. 你能够传入一个名字的数组,UglifyJS 会假设这些函数没有函数反作用。

举个栗子:

plugins: [
  new UglifyJSPlugin({
    uglifyOptions: {
      compress: {
          // 这样该函数会被认为没有函数反作用,整个声明会被废弃。在目前的执行状况下,会增长开销(压缩会变慢)。
          pure_funcs: ['Math.floor']
      }
    }
  })
],
复制代码

Tip:假如名字在做用域中从新定义,不会再次检测。例如 var q = Math.floor(a/b),假如变量 q 没有被引用,UglifyJS 会干掉它,但 Math.floor(a/b)会被保留,没有人知道它是干吗的。

  • side_effects -- 默认 true. 传 false 禁用丢弃纯函数。若是一个函数被调用前有一段/@PURE/ or /#PURE/ 注释,该函数会被标注为纯函数。例如 /@PURE/foo();

事实上,在这么多的压缩配置中,除了要解决反作用问题要手动配置之外,仅使用 UglifyJS 默认配置便可去除无用标记代码以实现 tree-shaking。

terser

以 terser 为例,terser 是一个用于 ES6+ 的 JavaScript 解析器和 mangler/compressor 工具包。具体可查看官方文档。 ​ 虽然没有中文文档,可是一眼扫过去也能够看出来配置参数和 UglifyJS 没有太大区别。固然很明显地多了一些参数:

  • arrows -- 若是转换后的代码更短,类和对象字面量方法也将被转换为箭头表达式
  • ecma -- 经过 ES2015 或 更高版原本启用压缩选项,将 ES5 代码转换为更小的 ES6+等效形式

​ 显然是由于 terser 支持 ES6+ 语法,这也是它淘汰 UglifyJS 的优点之一。

压缩性能 PK

目前 Webpack 已经更新到了版本 5.X,已经将 terser 插件默认内置且无需配置,虽然生产环境下默认使用 TerserPlugin ,而且也是代码压缩方面比较好的选择,可是还有一些其余可选择项。等等,咱们的主题不是 tree-shaking 吗?怎么在压缩工具的路上忽然越走越远...

本质上,实现 tree-shaking 的仍是压缩工具,因此咱们来看压缩工具的性能好像也没毛病!

TIP:压缩是在生产环境中生效的,因此生产环境下才能 tree-shaking。下面 3 个可配置插件要求 webpack 版本至少在 V4+。

UglifyjsWebpackPlugin

基本的使用方式也更加简单:

// webpack.config.js
const UglifyJsPlugin = require('uglifyjs-webpack-plugin');

module.exports = {
  optimization: {
    minimizer: [new UglifyJsPlugin()],
  },
};

const UglifyJsPlugin = require('uglifyjs-webpack-plugin')

module.exports = {
  plugins: [
    new UglifyJsPlugin()
  ]
}
复制代码

BabelMinifyWebpackPlugin

通常使用 babili 替代 UglifyJS 有 Babili 插件式和 babel-loader 预设两种方式。

Babili 插件式

只要用 Babili 插件替代 uglify 便可,此时也不须要 babel-loader 了:

// webpack.config.js
const MinifyPlugin = require("babel-minify-webpack-plugin");
module.exports = {
  plugins: [
    new MinifyPlugin(minifyOpts, pluginOpts)
  ]
}
复制代码

babel-loader 预设

官方文档最后有说明,Babel Minify 最适合针对最新的浏览器(具备完整的 ES6+ 支持),也能够与一般的 Babel es2015 预设一块儿使用,以首先向下编译代码。

在 webpack 中使用 babel-loader,而后再引入 minify 做为一个 preset 会比直接使用 BabelMinifyWebpackPlugin 插件执行得更快。由于 babel-minify 处理的文件体积会更小。

即在.babelrc 中配置以下:

{
  "presets": ["es2015"],
  "env": {
    "production": {
      "presets": ["minify"]
    }
  }
}
复制代码

但 BabelMinifyWebpackPlugin 插件存在一定有其没法替代的做用:

  • webpack loader 对单个文件进行操做, minify preset 做为一个 webpack loader 会把每一个文件视为在浏览器全局范围内直接执行(默认状况下),并不会优化顶级做用域内的某些内容;
  • 当排除 node_modules 不经过 babel-loader 运行时,babel-minify 优化不会应用于被排除的文件;
  • 当使用 babel-loader 时,由 webpack 为模块系统生成的代码不会经过 babel-minify 进行优化;
  • webpack 插件能够在整个 chunk/bundle 输出上运行,而且能够优化整个 bundle。

采用第一种方式:

TerserWebpackPlugin

同 uglify 和 babelMinify 插件同样,terser 插件配置使用也十分简单。

webpack.config.js
const TerserPlugin = require("terser-webpack-plugin");

module.exports = {
  optimization: {
    minimize: true,
    minimizer: [new TerserPlugin()],
  },
};
复制代码

企业微信截图_16247735356260.png

看上去结果是符合预期的,又由于个人文件代码自己体积就小,因此压缩包体积上的优点其实并不明显,但压缩时间上仍是比较明显的。 ​

官方数据性能对比

再来康康 bableMinify 文档 中给出的对比吧:

打包 react: react.png 打包 vue: vue.png

打包 lodash: lodash.png 打包 three.js: threejs.png

小结

先让咱们来看看 issue 区网友们是怎么说的: up.png

大意是 terser 压缩性能相较于 uglify 提高了三倍!Nice! no-up.png

大意是说:鉴于 terser-webpack-plugin 获得维护而且有更多的正确性修复,绝对是首选 -- 即便没有性能改进(事实上仍是有所改进的),也值得切换。 ​ 最后一句话总结:webpack 打包 + terser 压缩才是最终的不二之选!webpack5 内置 terser 说明了一切!

处理 Side Effects

「反作用」的定义是,在导入时会执行特殊行为的代码,而不是仅仅暴露一个 export 或多个 export。举例说明,例如 polyfill,它影响全局做用域,而且一般不提供 export。

关于反作用在 rollup 中也已经介绍过。有些模块导入,只要被引入,就会对应用程序产生重要的影响。好比全局样式表,或者设置全局配置的 JavaScript 文件就是很好的例子。

Webpack 认为这样的文件有“反作用”,具备反作用的文件不该该作 tree-shaking,由于这将破坏整个应用程序。webpack 的 tree-shaking 在反作用处理方面稍显逊色,它能够简单的判断变量后续是否被引用、修改,可是不能判断一个变量完整的修改过程,不知道它是否已经指向了外部变量,因此不少有可能会产生反作用的代码,都只能保守的不删除。

幸运的是,咱们能够经过配置项目,告诉 Webpack 哪些代码是没有反作用的,能够进行 tree-shaking。

配置参数

在项目的 package.json 文件中,添加 "sideEffects" 属性。package.json 有一个特殊的属性 sideEffects,就是为处理反作用而存在的 -- 向 webpack 的 compiler 提供提示哪些代码是“纯粹部分”。它有三个可能的值:

  • true 是默认值,若是不指定其余值的话。这意味着全部的文件都有反作用,也就是没有一个文件能够 tree-shaking。
  • false 告诉 Webpack 没有文件有反作用,全部文件均可以 tree-shaking。
  • 第三个值 […] 是文件路径数组。它告诉 webpack,除了数组中包含的文件外,你的任何文件都没有反作用。所以,除了指定的文件以外,其余文件均可以安全地进行 tree-shaking。
{
  "name": "your-project",
  "sideEffects": false
  // "sideEffects": [ // 数组方式支持相关文件的相对路径、绝对路径和 glob 模式
  // "./src/some-side-effectful-file.js",
  // "*.css"
  //]
}
复制代码

​ 每一个项目都必须将 sideEffects 属性设置为 false 或文件路径数组,若是你的代码确实有一些反作用,那么能够改成提供一个数组,在工做中须要正确配置 sideEffects 标记。

代码中标记

能够经过 /#PURE/ 注释能够告诉 webpack 一个函数调用是无反作用的。在函数调用以前,用来标记它们是无反作用的(pure)。 ​ 传到函数中的入参是没法被刚才的注释所标记,须要单独每个标记才能够。 ​ 若是一个没被使用的变量定义的初始值被认为是无反作用的(pure),它会被标记为死代码,不会被执行且会被压缩工具清除掉。当 optimization.innerGraph 被设置成 true 这个行为被会开启,而在 webpack5.x 中optimization.innerGraph 默认为 true。 ​

语法使用层面

  • 首先,mode 为 production 模式下才会启用更多优化项,包括咱们本文讲的压缩代码与 tree shaking;
  • 使用 ES2015 模块语法(即 import 和 export);
  • 确保没有编译器将 ES2015 模块语法转换为 CommonJS 的,把 presets 中的 modules 设置为 false,告诉 babel 不要编译模块代码。

总结

  • 若是是开发 JavaScript 库,使用 rollup!而且提供 ES6 module 的版本,入口文件地址设置到 package.json 的 module 字段;
  • 使用 webpack 哪怕是旧版本能够优先考虑 terser 插件做为压缩工具;
  • 为避免反作用,尽可能不写带有反作用的代码,使用 ES2015 模块语法;
  • 在项目 package.json 文件中,添加一个 sideEffects 入口,设置 sideEffects 属性为 false,也能够经过 /#PURE/ 注释强制删除一些认为不会产生反作用的代码;
  • 在 Webpack 中还要额外引入一个可以删除未引用代码(dead code)的压缩工具(eg. Terser)。

参考资料

保大人.gif

相关文章
相关标签/搜索