前端模块化/构建工具从最开始的基于浏览器运行时加载的 RequireJs/Sea.js
到将全部资源组装依赖打包 webpack
/rollup
/parcel
的bundle
类模块化构建工具,再到如今的bundleless
基于浏览器原生 ES 模块的 snowpack
/vite
,前端的模块化/构建工具发展到如今已经快 10 年了。javascript
本文主要回顾 10 年间,前端模块化/构建工具的发展历程及其实现原理。css
(因涉及一些历史、趋势,本文观点仅表明我的主观见解)html
一切的开始要从CommonJS规范提及。前端
CommonJS
原本叫ServerJs,其目标原本是为浏览器以外的javascript
代码制定规范,在那时NodeJs
尚未出生,有一些零散的应用于服务端的JavaScript
代码,可是没有完整的生态。vue
以后就是 NodeJs
从 CommonJS
社区的规范中吸收经验建立了自己的模块系统。java
CommonJs
是一套同步模块导入规范,可是在浏览器上还无法实现同步加载,这一套规范在浏览器上明显行不通,因此基于浏览器的异步模块 AMD
(Asynchronous Module Definition)规范诞生。node
define(id?, dependencies?, factory);
react
define("alpha", ["require", "exports", "beta"], function ( require, exports, beta ) { exports.verb = function () { return beta.verb(); //Or: return require("beta").verb(); }; });
AMD
规范采用依赖前置,先把须要用到的依赖提早写在 dependencies
数组里,在全部依赖下载完成后再调用factory
回调,经过传参来获取模块,同时也支持require("beta")
的方式来获取模块,但实际上这个require
只是语法糖,模块并不是在require
的时候导入,而是跟前面说的同样在调用factory
回调以前就被执行,关于依赖前置和执行时机这点在当时有很大的争议,被 CommonJs
社区所不容。webpack
在当时浏览器上应用CommonJs
还有另一个流派 module/2.0
, 其中有BravoJS
的 Modules/2.0-draft 规范和 FlyScript
的 Modules/Wrappings规范。git
代码实现大体以下:
module.declare(function (require, exports, module) { var a = require("a"); exports.foo = a.name; });
奈何RequireJs
如日中天,根本争不过。
关于这段的内容能够看玉伯的 前端模块化开发那点历史。
在不断给 RequireJs
提建议,但不断不被采纳后,玉伯结合RequireJs
和module/2.0
规范写出了基于 CMD(Common Module Definition)规范的Sea.js
。
define(factory);
define(function (require, exports, module) { var add = require("math").add; exports.increment = function (val) { return add(val, 1); }; });
在 CMD 规范中,一个模块就是一个文件。模块只有在被require
才会被执行。
相比于 AMD 规范,CMD 更加简洁,并且也更加易于兼容 CommonJS
和 Node.js
的 Modules
规范。
RequireJs
和Sea.js
都是利用动态建立script
来异步加载 js 模块的。
在做者仍是前端小白使用这两个库的时候就很好奇它是怎么在函数调用以前就获取到其中的依赖的,后来看了源码后恍然大悟,没想到就是简单的函数 toString
方法
经过对factory
回调toString
拿到函数的代码字符串,而后经过正则匹配获取require
函数里面的字符串依赖
这也是为何两者都不容许require
更换名称或者变量赋值,也不容许依赖字符串使用变量,只能使用字符串字面量的缘由
规范之争在当时仍是至关混乱的,先有CommonJs
社区,而后有了 AMD/CMD 规范和 NodeJs
的 module
规范,可是当那些CommonJs
的实现库逐渐没落,并随着NodeJs
愈来愈火,咱们口中所说的CommonJs
好像就只有 NodeJs
所表明的modules
了。
随着NodeJs
的逐渐流行,基于NodeJs
的自动化构建工具Grunt
诞生
Grunt
能够帮咱们自动化处理须要反复重复的任务,例如压缩(minification)、编译、单元测试、linting 等,还有强大的插件生态。
Grunt
采用配置化的思想:
module.exports = function (grunt) { // Project configuration. grunt.initConfig({ pkg: grunt.file.readJSON("package.json"), uglify: { options: { banner: '/*! <%= pkg.name %> <%= grunt.template.today("yyyy-mm-dd") %> */\n', }, build: { src: "src/<%= pkg.name %>.js", dest: "build/<%= pkg.name %>.min.js", }, }, }); // 加载包含 "uglify" 任务的插件。 grunt.loadNpmTasks("grunt-contrib-uglify"); // 默认被执行的任务列表。 grunt.registerTask("default", ["uglify"]); };
基于 nodejs
的一系列自动化工具的出现,也标志着前端进入了新的时代。
browserify
致力于在浏览器端使用CommonJs
,他使用跟 NodeJs
同样的模块化语法,而后将全部依赖文件编译到一个bundle
文件,在浏览器经过<script>
标签使用的,而且支持 npm 库。
var foo = require("./foo.js"); var gamma = require("gamma"); var elem = document.getElementById("result"); var x = foo(100); elem.textContent = gamma(x);
$ browserify main.js > bundle.js
当时RequireJs(r.js)
虽然也有了 node 端的 api 能够编译AMD
语法输出到单个文件,但主流的仍是使用浏览器端的RequireJs
。
AMD / RequireJS:
require(["./thing1", "./thing2", "./thing3"], function ( thing1, thing2, thing3 ) { // 告诉模块返回/导出什么 return function () { console.log(thing1, thing2, thing3); }; });
CommonJS:
var thing1 = require("./thing1"); var thing2 = require("./thing2"); var thing3 = require("./thing3"); // 告诉模块返回/导出什么 module.exports = function () { console.log(thing1, thing2, thing3); };
相比于 AMD 规范为浏览器作出的妥协,在服务端的预编译方面CommonJs
的语法更加友好。
经常使用的搭配就是 browserify
+ Grunt
,使用Grunt
的browserify
插件来构建模块化代码,并对代码进行压缩转换等处理。
如今有了RequireJs
,也有了browserify
可是这两个用的是不一样的模块化规范,因此有了 UMD - 通用模块规范,UMD 规范就是为了兼容AMD
和CommonJS
规范。就是如下这坨东西:
(function (global, factory) { typeof exports === "object" && typeof module !== "undefined" ? (module.exports = factory()) : typeof define === "function" && define.amd ? define(factory) : (global.libName = factory()); })(this, function () { "use strict"; });
上面说到Grunt
是基于配置的,配置化的上手难度较高,须要了解每一个配置的参数,当配置复杂度上升的时候,代码看起来比较混乱。gulp
基于代码配置和对 Node.js
流的应用使得构建更简单、更直观。能够配置更加复杂的任务。
var browserify = require("browserify"); var source = require("vinyl-source-stream"); var buffer = require("vinyl-buffer"); var uglify = require("gulp-uglify"); var size = require("gulp-size"); var gulp = require("gulp"); gulp.task("build", function () { var bundler = browserify("./index.js"); return bundler .bundle() .pipe(source("index.js")) .pipe(buffer()) .pipe(uglify()) .pipe(size()) .pipe(gulp.dest("dist/")); });
以上是一个配置browserify
的例子,能够看出来很是简洁直观。
在说webpack
以前,先放一下阮一峰老师的吐槽
webpack1
支持CommonJs
和AMD
模块化系统,优化依赖关系,支持分包,支持多种类型 script、image、file、css/less/sass/stylus、mocha/eslint/jshint 的打包,丰富的插件体系。
以上的 3 个库 Grunt/Gulp/browserify
都是偏向于工具,而 webpack
将以上功能都集成到一块儿,相比于工具它的功能大而全。
webpack
的概念更偏向于工程化,可是在当时并无立刻火起来,由于当时的前端开发并无太复杂,有一些 mvc 框架但都是昙花一现,前端的技术栈在 requireJs/sea.js、grunt/gulp、browserify、webpack 这几个工具之间抉择。
webpack
真正的火起来是在2015/2016
,随着ES2015
(ES6
)发布,不止带来了新语法,也带来了属于前端的模块规范ES module
,vue/react/Angular
三大框架打得火热,webpack2
发布:支持ES module
、babel
、typescript
,jsx,Angular 2 组件和 vue 组件,webpack
搭配react/vue/Angular
成为最佳选择,至此前端开发离不开webpack
,webpack
真正成为前端工程化的核心。
webpack
的其余功能就不在这里赘述。
webpack
主要的三个模块就是,后两个也是咱们常常配置的:
webpack
依赖于Tapable
作事件分发,内部有大量的hooks
钩子,在Compiler
和compilation
核心流程中经过钩子分发事件,在plugins
中注册钩子,实际代码全都由不一样的内置 plugins
来执行,而 loader
在中间负责转换代码接受一个源码处理后返回处理结果content string -> result string
。
由于钩子太多了,webpack
源码看起来十分的绕,简单说一下大体流程:
webpack.config.js
来获取参数compiler
对象,初始化plugins
addEntry
添加入口资源addModule
建立模块runLoaders
执行 loader
acorn
解析为 AST
,而后查找依赖,并重复 4 步compilation.seal
optimize
优化依赖,生成 chunks
,写入文件webpack
的优势就不用说了,如今说一下 2 个缺点:
配置复杂这一块一直是webpack
被吐槽的一点,主要仍是太重的插件系统,复杂的插件配置,插件文档也不清晰,更新过快插件没跟上或者文档没跟上等问题。
好比如今 webpack
已经到 5 了网上一搜全都是 webpack3
的文章,每每是新增一个功能,按照文档配置完后,诶有报错,网上一顿查,这里拷贝一段,那里拷贝一段,又来几个报错,又通过一顿搞后终于能够运行。
后来针对这个问题,衍生出了前端脚手架,react
出了create-react-app
,vue
出了vue-cli
,脚手架内置了webpack
开发中的经常使用配置,达到了 0 配置,开发者无需关心 webpack
的复杂配置。
2015 年,前端的ES module
发布后,rollup
应声而出。
rollup
编译ES6
模块,提出了Tree-shaking
,根据ES module
静态语法特性,删除未被实际使用的代码,支持导出多种规范语法,而且导出的代码很是简洁,若是看过 vue
的dist
目录代码就知道导出的 vue
代码彻底不影响阅读。
rollup
的插件系统支持:babel
、CommonJs
、terser
、typescript
等功能。
相比于browserify
的CommonJs
,rollup
专一于ES module
。
相比于webpack
大而全的前端工程化,rollup
专一于纯javascript
,大多被用做打包tool
工具或library
库。
react、vue 等库都使用rollup
打包项目,而且下面说到的vite
也依赖rollup
用做生产环境打包 js。
export const a = 1; export const b = 2;
import { a } from "./num"; console.log(a);
以上代码最终打包后 b 的声明就会被删除掉。
这依赖ES module
的静态语法,在编译阶段就能够肯定模块的导入导出有哪些变量。
CommonJs
由于是基于运行时的模块导入,其导出的是一个总体,而且require(variable)
内容能够为变量,因此在ast
编译阶段没办法识别为被使用的依赖。
webpack4
中也开始支持tree-shaking
,可是由于历史缘由,有太多的基于CommonJS
代码,须要额外的配置。
上面提到过webpack
的两个缺点,而parcel
的诞生就是为了解决这两个缺点,parcel 主打极速零配置。
打包工具 | 时间 |
---|---|
browserify | 22.98s |
webpack | 20.71s |
parcel | 9.98s |
parcel - with cache | 2.64s |
以上是 parcel
官方的一个数据,基于一个合理大小的应用,包含 1726 个模块,6.5M 未压缩大小。在一台有 4 个物理核心 CPU 的 2016 MacBook Pro 上构建。
parcel
使用 worker
进程去启用多核编译,而且使用文件缓存。
parcel
支持 0 配置,内置了 html、babel、typescript、less、sass、vue
等功能,无需配置,而且不一样于webpack
只能将 js 文件做为入口,在 parcel
中万物皆资源,因此 html
文件 css
文件均可以做为入口来打包。
因此不须要webpack
的复杂配置,只须要一个parcel index.html
命令就能够直接起一个自带热更新的server
来开发vue/react
项目。
parcel 也有它的缺点:
webpack
比较小众,若是遇到错误查找解决方案比较麻烦。commander
获取命令server
服务,启动 watch
监听文件,启动 WebSocket
服务用于 hmr,启动多线程asset
资源,例如jsAsset
、cssAsset
、vueAsset
,若是parcel
识别 less
文件后项目内若是没有 less
库会自动安装asset
内方法parse -> ast -> 收集依赖 -> transform(转换代码) -> generate(生成代码)
,在这个过程当中收集到依赖,编译完结果写入缓存createBundleTree
建立依赖树,替换 hash 等,package
打包生成最终代码watch
文件发生变化,重复第 4 步,并将结果 7 经过WebSocket
发送到浏览器,进行热更新。一个完整的模块化打包工具就以上功能和流程。
browserify
、webpack
、rollup
、parcel
这些工具的思想都是递归循环依赖,而后组装成依赖树,优化完依赖树后生成代码。
可是这样作的缺点就是慢,须要遍历完全部依赖,即便 parcel
利用了多核,webpack
也支持多线程,在打包大型项目的时候依然慢可能会用上几分钟,存在性能瓶颈。
因此基于浏览器原生 ESM
的运行时打包工具出现:
仅打包屏幕中用到的资源,而不用打包整个项目,开发时的体验相比于 bundle
类的工具只能用极速来形容。
(实际生产环境打包依然会构建依赖方式打包)
由于 snowpack
和 vite
比较相似,都是bundleless
因此一块儿拿来讲,区别能够看一下 vite 和 snowpack 区别,这里就不赘述了。
bundleless
类运行时打包工具的启动速度是毫秒级的,由于不须要打包任何内容,只须要起两个server
,一个用于页面加载,另外一个用于HMR
的WebSocket
,当浏览器发出原生的ES module
请求,server
收到请求只需编译当前文件后返回给浏览器不须要管依赖。
bundleless
工具在生产环境打包的时候依然bundle
构建因此依赖视图的方式,vite 是利用 rollup
打包生产环境的 js 的。
原理拿 vite
举例:
vite
在启动服务器后,会预先以全部 html 为入口,使用 esbuild
编译一遍,把全部的 node_modules
下的依赖编译并缓存起来,例如vue
缓存为单个文件。
当打开在浏览器中输入连接,渲染index.html
文件的时候,利用浏览器自带的ES module
来请求文件。
<script type="module" src="/src/main.js"></script>
vite 收到一个src/main.js
的 http
文件请求,使用esbuild
开始编译main.js
,这里不进行main.js
里面的依赖编译。
import { createApp } from "vue"; import App from "./App.vue"; createApp(App).mount("#app");
浏览器获取到并编译main.js
后,再次发出 2 个请求,一个是 vue
的请求,由于前面已经说了 vue 被预先缓存下来,直接返回缓存给浏览器,另外一个是App.vue
文件,这个须要@vitejs/plugin-vue
来编译,编译完成后返回结果给浏览器(@vitejs/plugin-vue
会在脚手架建立模板的时候自动配置)。
由于是基于浏览器的ES module
,因此编译过程当中须要把一些 CommonJs
、UMD
的模块都转成 ESM
。
Vite
同时利用 HTTP
头来加速整个页面的从新加载(再次让浏览器为咱们作更多事情):源码模块的请求会根据 304 Not Modified
进行协商缓存,而依赖模块请求则会经过 Cache-Control: max-age=31536000,immutable
进行强缓存,所以一旦被缓存它们将不须要再次请求,即便缓存失效只要服务没有被杀死,编译结果依然保存在程序内存中也会很快返回。
上面屡次提到了esbuild
,esbuild
使用 go
语言编写,因此在 i/o
和运算运行速度上比解释性语言 NodeJs
快得多,esbuild
号称速度是 node
写的其余工具的 10~100 倍。
ES module
依赖运行时编译的概念 + esbuild
+ 缓存 让 vite
的速度远远甩开其余构建工具。
简单的汇总:
前端运行时模块化
RequireJs
AMD 规范sea.js
CMD 规范自动化工具
Grunt
基于配置Gulp
基于代码和文件流模块化
browserify
基于CommonJs
规范只负责模块化rollup
基于ES module
,tree shaking
优化代码,支持多种规范导出,可经过插件集成压缩、编译、commonjs 语法 等功能工程化
webpack
大而全的模块化构建工具parcel
极速 0 配置的模块化构建工具snowpack/vite
ESM
运行时模块化构建工具这 10 年,前端的构建工具随着 nodejs
的逐渐成熟衍生出一系列的工具,除了文中列举的还有一些其余的工具,或者基于这些工具二次封装,在nodejs
出现以前前端也不是没有构建工具虽然不多,只能说nodejs
的出现让更多人能够参与进来,尤为是前端可使用自己熟悉的语言参与到开发工具使用工具中,npm 上至今已经有 17 万个包,周下载量 300 亿。
在这个过程当中也有些模块化历史遗留问题,咱们如今还在使用着 UMD 规范库来兼容这 AMD 规范,npm 的包大都是基于CommonJs
,不得不兼容ESM
和CommonJs
。
webpack
统治前端已经 5 年,人们提到开发项目只会想到 webpack
,而下一个 5 年会由谁来替代?snowpack/vite
吗,当打包速度达到 0 秒后,将来有没有可能出现新一代的构建工具?下一个 10 年前端又会有什么变化?