深刻 Parcel--架构与流程篇

图片描述

本篇文章是对 Parce 的源码解析,代码基本架构与执行流程,带你了解打包工具的内部原理,在这以前你若是对 parcel 不熟悉能够先到 Parcel官网 了解javascript

介绍

下面是偷懒从官网抄下来的介绍:css

极速零配置Web应用打包工具
  • 极速打包

Parcel 使用 worker 进程去启用多核编译。同时有文件系统缓存,即便在重启构建后也能快速再编译。html

  • 将你全部的资源打包

Parcel 具有开箱即用的对 JS, CSS, HTML, 文件 及更多的支持,并且不须要插件。vue

  • 自动转换

如如有须要,Babel, PostCSS, 和 PostHTML 甚至 node_modules 包会被用于自动转换代码.java

  • 零配置代码分拆

使用动态 import() 语法, Parcel 将你的输出文件束(bundles)分拆,所以你只须要在初次加载时加载你所须要的代码。node

  • 热模块替换

Parcel 无需配置,在开发环境的时候会自动在浏览器内随着你的代码更改而去更新模块。webpack

  • 友好的错误日志

当遇到错误时,Parcel 会输出 语法高亮的代码片断,帮助你定位问题。es6

打包工具 时间
browserify 22.98s
webpack 20.71s
parcel 9.98s
parcel - with cache 2.64s

打包工具

咱们经常使用的打包工具大体功能:web

  • 模块化(代码的拆分, 合并, Tree-Shaking 等)
  • 编译(es6,7,8 sass typescript 等)
  • 压缩 (js, css, html包括图片的压缩)
  • HMR (热替换)

version

parcel-bundler 版本:typescript

"version": "1.11.0"

文件架构

|-- assets          资源目录 继承自 Asset.js
|-- builtins        用于最终构建
|-- packagers       打包
|-- scope-hoisting  做用域提高 Tree-Shake
|-- transforms      转换代码为 AST
|-- utils           工具
|-- visitors        遍历 js AST树 收集依赖等

|-- Asset.js          资源
|-- Bundle.js         用于构建 bundle 树
|-- Bundler.js        主目录  
|-- FSCache.js        缓存
|-- HMRServer.js      HMR服务器提供 WebSocket
|-- Parser.js         根据文件扩展名获取对应 Asset
|-- Pipeline.js       多线程执行方法
|-- Resolver.js       解析模块路径
|-- Server.js         静态资源服务器
|-- SourceMap.js      SourceMap
|-- cli.js            cli入口 解析命令行参数
|-- worker.js         多线程入口

流程

说明

Parcel是面向资源的,JavaScript,CSS,HTML 这些都是资源,并非 webpackjs 是一等公民,Parcel 会自动的从入口文件开始分析这些文件 和 模块中的依赖,而后构建一个 bundle 树,并对其进行打包输出到指定目录

一个简单的例子

咱们从一个简单的例子开始了解 parcel 内部源码与流程

index.html
  |-- index.js
    |-- module1.js
    |-- module2.js

上面是咱们例子的结构,入口为 index.html, 在 index.html 中咱们用 script 标签引用了 src/index.js,在 index.js 中咱们引入了2个子模块

执行

npx parcel index.html 或者 ./node_modules/.bin/parcel index.html,或者使用 npm script

cli

"bin": {
    "parcel": "bin/cli.js"
}

查看 parcel-bundlerpackage.json 找到 bin/cli.js,在cli.js里又指向 ../src/cli

const program = require('commander');

program
  .command('serve [input...]') // watch build
  ...
  .action(bundle);

program.parse(process.argv);

async function bundle(main, command) {
  const Bundler = require('./Bundler');

  const bundler = new Bundler(main, command);

  if (command.name() === 'serve' && command.target === 'browser') {
    const server = await bundler.serve();

    if (server && command.open) {...启动自动打开浏览器}
  } else {
    bundler.bundle();
  }
}

cli.js 中利用 commander 解析命令行并调用 bundle 方法
serve, watch, build 3个命令来调用 bundle 函数,执行 pracel index.html 默认为 serve,因此调用的是 bundler.serve 方法

进入 Bundler.js

bundler.serve

async serve(port = 1234, https = false, host) {
    this.server = await Server.serve(this, port, host, https);
    try {
      await this.bundle();
    } catch (e) {}
    return this.server;
  }

bundler.serve 方法 调用 serveStatic 起了一个静态服务指向 最终打包的文件夹
下面就是重要的 bundle 方法

bundler.bundle

async bundle() {
    // 加载插件 设置env 启动多线程 watcher hmr
    await this.start();

    if (isInitialBundle) {
      // 建立 输出目录
      await fs.mkdirp(this.options.outDir);

      this.entryAssets = new Set();
      for (let entry of this.entryFiles) {
          let asset = await this.resolveAsset(entry);
          this.buildQueue.add(asset);
          this.entryAssets.add(asset);
      }
    }

    // 打包队列中的资源
    let loadedAssets = await this.buildQueue.run();

    // findOrphanAssets 获取全部资源中独立的没有父Bundle的资源
    let changedAssets = [...this.findOrphanAssets(), ...loadedAssets];

    // 由于接下来要构建 Bundle 树,先对上一次的 Bundle树 进行 clear 操做
    for (let asset of this.loadedAssets.values()) {
      asset.invalidateBundle();
    }

    // 构建 Bundle 树
    this.mainBundle = new Bundle();
    for (let asset of this.entryAssets) {
      this.createBundleTree(asset, this.mainBundle);
    }

    // 获取新的最终打包文件的url
    this.bundleNameMap = this.mainBundle.getBundleNameMap(
      this.options.contentHash
    );
    // 将代码中的旧文件url替换为新的
    for (let asset of changedAssets) {
      asset.replaceBundleNames(this.bundleNameMap);
    }

    // 将改变的资源经过websocket发送到浏览器
    if (this.hmr && !isInitialBundle) {
      this.hmr.emitUpdate(changedAssets);
    }

    // 对资源打包
    this.bundleHashes = await this.mainBundle.package(
      this,
      this.bundleHashes
    );

    // 将独立的资源删除
    this.unloadOrphanedAssets();

    return this.mainBundle;
  }

咱们一步步先从 this.start

start

if (this.farm) {
  return;
}

await this.loadPlugins();

if (!this.options.env) {
  await loadEnv(Path.join(this.options.rootDir, 'index'));
  this.options.env = process.env;
}

if (this.options.watch) {
  this.watcher = new Watcher();
  this.watcher.on('change', this.onChange.bind(this));
}

if (this.options.hmr) {
  this.hmr = new HMRServer();
  this.options.hmrPort = await this.hmr.start(this.options);
}

this.farm = await WorkerFarm.getShared(this.options, {
  workerPath: require.resolve('./worker.js')
  });

start:

  • 开头的判断 防止屡次执行,也就是说 this.start 只会执行一次
  • loadPlugins 加载插件,找到 package.json 文件 dependencies, devDependenciesparcel-plugin-开头的插件进行调用
  • loadEnv 加载环境变量,利用 dotenv, dotenv-expand 包将 env.development.local, .env.development, .env.local, .env 扩展至 process.env
  • watch 初始化监听文件并绑定 change 回调函数,内部 child_process.fork 起一个子进程,使用 chokidar 包来监听文件改变
  • hmr 起一个服务,WebSocket 向浏览器发送更改的资源
  • farm 初始化多进程并指定 werker 工做文件,开启多个 child_process 去解析编译资源

接下来回到 bundleisInitialBundle 是一个判断是不是第一次构建
fs.mkdirp 建立输出文件夹
遍历入口文件,经过 resolveAsset,内部调用 resolver 解析路径,并 getAsset 获取到对应的 asset(这里咱们入口是 index.html,根据扩展名获取到的是 HTMLAsset
asset 添加进队列
而后启动 this.buildQueue.run() 对资源从入口递归开始打包

PromiseQueue

这里 buildQueue 是一个 PromiseQueue 异步队列
PromiseQueue 在初始化的时候传入一个回调函数 callback,内部维护一个参数队列 queueadd 往队列里 push 一个参数,run 的时候while遍历队列 callback(...queue.shift()),队列所有执行完毕 Promise 置为完成(resolved)(能够将其理解为 Promise.all
这里定义的回调函数是 processAsset,参数就是入口文件 index.htmlHTMLAsset

async processAsset(asset, isRebuild) {
  if (isRebuild) {
    asset.invalidate();
    if (this.cache) {
      this.cache.invalidate(asset.name);
    }
  }

  await this.loadAsset(asset);
}

processAsset 函数内先判断是不是 Rebuild ,是第一次构建,仍是 watch 监听文件改变进行的重建,若是是重建则对资源的属性重置,并使其缓存失效
以后调用 loadAsset 加载资源编译资源

loadAsset

async loadAsset(asset) {
    if (asset.processed) {
      return;
    }

    // Mark the asset processed so we don't load it twice
    asset.processed = true;

    // 先尝试读缓存,缓存没有在后台加载和编译
    asset.startTime = Date.now();
    let processed = this.cache && (await this.cache.read(asset.name));
    let cacheMiss = false;
    if (!processed || asset.shouldInvalidate(processed.cacheData)) {
      processed = await this.farm.run(asset.name);
      cacheMiss = true;
    }

    asset.endTime = Date.now();
    asset.buildTime = asset.endTime - asset.startTime;
    asset.id = processed.id;
    asset.generated = processed.generated;
    asset.hash = processed.hash;
    asset.cacheData = processed.cacheData;

    // 解析和加载当前资源的依赖项
    let assetDeps = await Promise.all(
      dependencies.map(async dep => {
          dep.parent = asset.name;
          let assetDep = await this.resolveDep(asset, dep);
          if (assetDep) {
            await this.loadAsset(assetDep);
          }
          return assetDep;
      })
    );

    if (this.cache && cacheMiss) {
      this.cache.write(asset.name, processed);
    }
  }

loadAsset 在开始有个判断防止重复编译
以后去读缓存,读取失败就调用 this.farm.run 在多进程里编译资源
编译完就去加载并编译依赖的文件
最后若是是新的资源没有用到缓存,就从新设置一下缓存
下面说一下这里吗涉及的两个东西:缓存 FSCache 和 多进程 WorkerFarm

FSCache

read 读取缓存,并判断最后修改时间和缓存的修改时间
write 写入缓存

图片描述

缓存目录为了加速读取,避免将全部的缓存文件放在一个文件夹里,parcel16进制 两位数的 256 种可能建立为文件夹,这样存取缓存文件的时候,将目标文件路径 md5 加密转换为 16进制,而后截取前两位是目录,后面几位是文件名

WorkerFarm

在上面 start 里初始化 farm 的时候,workerPath 指向了 worker.js 文件,worker.js 里有两个函数,init run
WorkerFarm.getShared 初始化的时候会建立一个 new WorkerFarm ,调用 worker.jsinit 方法,根据 cpu 获取最大的 Worker 数,并启动一半的子进程
farm.run 会通知子进程执行 worker.jsrun 方法,若是进程数没有达到最大会再次开启一个新的子进程,子进程执行完毕后将 Promise状态更改成完成
worker.run -> pipeline.process -> pipeline.processAsset -> asset.process
Asset.process 处理资源:

async process() {
    if (!this.generated) {
      await this.loadIfNeeded();
      await this.pretransform();
      await this.getDependencies();
      await this.transform();
      this.generated = await this.generate();
    }

    return this.generated;
  }

将上面的代码内部扩展一下:

async process() {
  // 已经有就不须要编译
  if (!this.generated) {
    // 加载代码
    if (this.contents == null) {
      this.contents = await this.load();
    }
    // 可选。在收集依赖以前转换。
    await this.pretransform();
    // 将代码解析为 AST 树
    if (!this.ast) {
      this.ast = await this.parse(this.contents);
    }
    // 收集依赖
    await this.collectDependencies();
    // 可选。在收集依赖以后转换。
    await this.transform();
    // 生成代码
    this.generated = await this.generate();
  }

  return this.generated;
}

// 最后处理代码
async postProcess(generated) {
  return generated
}

processAsset 中调用 asset.process 生成 generated 这个generated 不必定是最终代码 ,像 html里内联的 script ,vuehtml, js, css,都会进行二次或屡次递归处理,最终调用 asset.postProcess 生成代码

Asset

下面说几个实现
HTMLAsset

  • pretransform 调用 posthtmlhtml 解析为 PostHTMLTree(若是没有设置posthtmlrc之类的不会走)
  • parse 调用 posthtml-parserhtml 解析为 PostHTMLTree
  • collectDependencies 用 walk 遍历 ast,找到 script, imgsrclinkhref 等的地址,将其加入到依赖
  • transform htmlnano 压缩代码
  • generate 处理内联的 scriptcss
  • postProcess posthtml-render 生成 html 代码

JSAsset

  • pretransform 调用 @babel/corejs 解析为 AST,处理 process.env
  • parse 调用 @babel/parserjs 解析为 AST
  • collectDependencies 用 babylon-walk 遍历 ast, 如 ImportDeclarationimport xx from 'xx' 语法,CallExpression 找到 require调用,import 被标记为 dynamic 动态导入,将这些模块加入到依赖
  • transform 处理 readFileSync__dirname, __filename, global等,若是没有设置scopeHoist 并存在 es6 module 就将代码转换为 commonjsterser 压缩代码
  • generate @babel/generator 获取 jssourceMap 代码

VueAsset

  • parse @vue/component-compiler-utilsvue-template-compiler.vue 文件进行解析
  • generate 对 html, js, css 处理,就像上面说到会对其分别调用 processAsset 进行二次解析
  • postProcess component-compiler-utilscompileTemplate, compileStyle处理 html,cssvue-hot-reload-api HMR处理,压缩代码

回到 bundle 方法:

let loadedAssets = await this.buildQueue.run() 就是上面说到的PromiseQueueWorkerFarm 结合起来:buildQueue.run —> processAsset -> loadAsset -> farm.run -> worker.run -> pipeline.process -> pipeline.processAsset -> asset.process,执行以后全部资源编译完毕,并返回入口资源loadedAssets就是 index.html 对应的 HTMLAsset 资源

以后是 let changedAssets = [...this.findOrphanAssets(), ...loadedAssets] 获取到改变的资源

findOrphanAssets 是从全部资源中查找没有 parentBundle 的资源,也就是独立的资源,这个 parentBundle 会在等会的构建 Bundle 树中被赋值,第一次构建都没有 parentBundle,因此这里会重复入口文件,这里的 findOrphanAssets 的做用是在第一次构建以后,文件change的时候,在这个文件 import了新的一个文件,由于新文件没有被构建过 Bundle 树,因此没有 parentBundle,这个新文件也被标记物 change

invalidateBundle 由于接下来要构建新的树因此调用重置全部资源上一次树的属性

createBundleTree 构建 Bundle 树:
首先一个入口资源会被建立成一个 bundle,而后动态的 import() 会被建立成子 bundle ,这引起了代码的拆分。

当不一样类型的文件资源被引入,兄弟 bundle 就会被建立。例如你在 JavaScript 中引入了 CSS 文件,那它会被放置在一个与 JavaScript 文件对应的兄弟 bundle 中。

若是资源被多于一个 bundle 引用,它会被提高到 bundle 树中最近的公共祖先中,这样该资源就不会被屡次打包。

Bundle

  • type:它包含的资源类型 (例如:js, css, map, ...)
  • name:bundle 的名称 (使用 entryAsset 的 Asset.generateBundleName() 生成)
  • parentBundle:父 bundle ,入口 bundle 的父 bundle 是 null
  • entryAsset:bundle 的入口,用于生成名称(name)和聚拢资源(assets)
  • assets:bundle 中全部资源的集合(Set)
  • childBundles:全部子 bundle 的集合(Set)
  • siblingBundles:全部兄弟 bundle 的集合(Set)
  • siblingBundlesMap:全部兄弟 bundle 的映射 Map<String(Type: js, css, map, ...), Bundle>
  • offsets:全部 bundle 中资源位置的映射 Map<Asset, number(line number inside the bundle)> ,用于生成准确的 sourcemap 。

咱们的例子会被构建成:

html            ( index.html )
  |-- js        ( index.js, module1.js, module2.js )
    |-- map     ( index.js, module1.js, module2.js )

module1.jsmodule2.js 被提到了与 index.js 同级,map 由于类型不一样被放到了 子bundle

一个复杂点的树:

// 资源树
index.html
  |-- index.css
  |-- bg.png
  |-- index.js
    |-- module.js
// mainBundle
html            ( index.html )
  |-- js        ( index.js, module.js )
    |-- map     ( index.map, module.map )
  |-- css       ( index.css )
    |-- js      ( index.css, css-loader.js bundle-url.js )
    |-- map     ( css-loader.js, bundle-url.js )
  |-- png       ( bg.png )

由于要对 css 热更新,因此新增了 css-loader.js, bundle-url.js 两个 js

replaceBundleNames替换引用:生成树以后将代码中的文件引用替换为最终打包的文件名,若是是生产环境会替换为 contentHash 根据内容生成 hash

hmr更新: 判断启用 hmr 而且不是第一次构建的状况,调用 hmr.emitUpdate 将改变的资源发送给浏览器

Bundle.package 打包

unloadOrphanedAssets 将独立的资源删除

package

packagegenerated 写入到文件
有6种打包:
CSSPackagerHTMLPackagerSourceMapPackagerJSPackagerJSConcatPackagerRawPackager
当开启 scopeHoist 时用 JSConcatPackager 不然 JSPackager
图片等资源用 RawPackager

最终咱们的例子被打包成 index.html, src.[hash].js, src.[hash].map 3个文件

index.html 里的 js 路径被替换成立最终打包的地址

咱们看一下打包的 js:

parcelRequire = (function (modules, cache, entry, globalName) {
  // Save the require from previous bundle to this closure if any
  var previousRequire = typeof parcelRequire === 'function' && parcelRequire;
  var nodeRequire = typeof require === 'function' && require;

  function newRequire(name, jumped) {
    if (!cache[name]) {
      localRequire.resolve = resolve;
      localRequire.cache = {};

      var module = cache[name] = new newRequire.Module(name);

      modules[name][0].call(module.exports, localRequire, module, module.exports, this);
    }

    return cache[name].exports;

    function localRequire(x){
      return newRequire(localRequire.resolve(x));
    }

    function resolve(x){
      return modules[name][4][x] || x;
    }
  }
  for (var i = 0; i < entry.length; i++) {
    newRequire(entry[i]);
  }
  // Override the current require with this new one
  return newRequire;
})({"src/module1.js":[function(require,module,exports) {
"use strict";

},{}],"src/module2.js":[function(require,module,exports) {
"use strict";

},{}],"src/index.js":[function(require,module,exports) {
"use strict";

var _module = require("./module");

var _module2 = require("./module1");

var _module3 = require("./module2");
console.log(_module.m);
},{"./module":"src/module.js","./module1":"src/module1.js","./module2":"src/module2.js","fs":"node_modules/parcel-bundler/src/builtins/_empty.js"}]
,{}]},{},["node_modules/parcel-bundler/src/builtins/hmr-runtime.js","src/index.js"], null)
//# sourceMappingURL=/src.a2b27638.map

能够看到代码被拼接成了对象的形式,接收参数 module, require 用来模块导入导出,实现了 commonjs 的模块加载机制,一个更加简化版:

parcelRequire = (function (modules, cache, entry, globalName) {
  function newRequire(id){
    if(!cache[id]){
      let module = cache[id] = { exports: {} }
      modules[id][0].call(module.exports, newRequire, module, module.exports, this);
    }
    return cache[id]
  }
  for (var i = 0; i < entry.length; i++) {
    newRequire(entry[i]);
  }
  return newRequire;
})()

代码被拼接起来:

`(function(modules){
  //...newRequire
})({` +
  asset.id +
    ':[function(require,module,exports) {\n' +
        asset.generated.js +
      '\n},' +
'})'
(function(modules){
  //...newRequire
})({
  "src/index.js":[function(require,module,exports){
    // code
  }]
})

hmr-runtime

上面打包的 js 中还有个 hmr-runtime.js 太长被我省略了
hmr-runtime.js 建立一个 WebSocket 监听服务端消息
修改文件触发 onChange 方法,onChange 将改变的资源 buildQueue.add 加入构建队列,从新调用 bundle 方法,打包资源,并调用 emitUpdate 通知浏览器更新
当浏览器接收到服务端有新资源更新消息时
新的资源就会设置或覆盖以前的模块
modules[asset.id] = new Function('require', 'module', 'exports', asset.generated.js)
对模块进行更新:

function hmrAccept(id){
  // dispose 回调
  cached.hot._disposeCallbacks.forEach(function (cb) {
    cb(bundle.hotData);
  });

  delete bundle.cache[id]; // 删除以前缓存
  newRequire(id); // 从新此加载

  // accept 回调
  cached.hot._acceptCallbacks.forEach(function (cb) {
    cb();
  });

  // 递归父模块 进行更新
  getParents(global.parcelRequire, id).some(function (id) {
    return hmrAccept(global.parcelRequire, id);
  });
}

至此整个打包流程结束

总结

parcle index.html
进入 cli,启动Server调用 bundle,初始化配置(Plugins, env, HMRServer, Watcher, WorkerFarm),从入口资源开始,递归编译(babel, posthtml, postcss, vue-template-compiler等),编译完设置缓存,构建 Bundle 树,进行打包
若是没有 watch 监听,结束关闭 Watcher, Worker, HMR
watch 监听:
文件修改,触发 onChange,将修改的资源加入构建队列,递归编译,查找缓存(这一步缓存的做用就提醒出来了),编译完设置新缓存,构建 Bundle 树,进行打包,将 change 的资源发送给浏览器,浏览器接收 hmr 更新资源

最后

经过此文章但愿你对 parcel 的大体流程,打包工具原理有更深的了解
了解更多请关注专栏,后续 深刻Parcel 同系列文章,对 AssetPackagerWorkerHMRscopeHoistFSCacheSourceMapimport 更加 详细讲解代码实现

相关文章
相关标签/搜索