JavaScript Source Map 详解

上周,jQuery 1.9发布。html

这是2.0版以前的最后一个新版本,有不少新功能,其中一个就是支持Source Map。html5

访问 http://ajax.googleapis.com/ajax/libs/jquery/1.9.0/jquery.min.js,打开压缩后的版本,滚动到底部,你能够看到最后一行是这样的:java

  //@ sourceMappingURL=jquery.min.mapjquery

这就是Source Map。它是一个独立的map文件,与源码在同一个目录下,你能够点击进去,看看它的样子。git

这是一个颇有用的功能,本文将详细讲解这个功能。github

1、从源码转换讲起ajax

JavaScript脚本正变得愈来愈复杂。大部分源码(尤为是各类函数库和框架)都要通过转换,才能投入生产环境。api

常见的源码转换,主要是如下三种状况:数组

  (1)压缩,减少体积。好比jQuery 1.9的源码,压缩前是252KB,压缩后是32KB。浏览器

  (2)多个文件合并,减小HTTP请求数。

  (3)其余语言编译成JavaScript。最多见的例子就是CoffeeScript。

这三种状况,都使得实际运行的代码不一样于开发代码,除错(debug)变得困难重重。

一般,JavaScript的解释器会告诉你,第几行第几列代码出错。可是,这对于转换后的代码毫无用处。举例来讲,jQuery 1.9压缩后只有3行,每行3万个字符,全部内部变量都改了名字。你看着报错信息,感到毫无头绪,根本不知道它所对应的原始位置。

这就是Source map想要解决的问题。

2、什么是Source map

简单说,Source map就是一个信息文件,里面储存着位置信息。也就是说,转换后的代码的每个位置,所对应的转换前的位置。

有了它,出错的时候,除错工具将直接显示原始代码,而不是转换后的代码。这无疑给开发者带来了很大方便。

目前,暂时只有Chrome浏览器支持这个功能。在Developer Tools的Setting设置中,确认选中"Enable source maps"。

3、如何启用Source map

正如前文所提到的,只要在转换后的代码尾部,加上一行就能够了。

  //@ sourceMappingURL=/path/to/file.js.map

map文件能够放在网络上,也能够放在本地文件系统。

4、如何生成Source map

最经常使用的方法是使用Google的Closure编译器

生成命令的格式以下:

  java -jar compiler.jar \
    --js script.js \
    --create_source_map ./script-min.js.map \
    --source_map_format=V3 \
    --js_output_file script-min.js

各个参数的意义以下:

  - js: 转换前的代码文件
  - create_source_map: 生成的source map文件
  - source_map_format:source map的版本,目前一概采用V3。
  - js_output_file: 转换后的代码文件。

其余的生成方法能够参考这篇文章

5、Source map的格式

打开Source map文件,它大概是这个样子:

  {
    version : 3,
    file: "out.js",
    sourceRoot : "",
    sources: ["foo.js", "bar.js"],
    names: ["src", "maps", "are", "fun"],
    mappings: "AAgBC,SAAQ,CAAEA"
  }

整个文件就是一个JavaScript对象,能够被解释器读取。它主要有如下几个属性:

  - version:Source map的版本,目前为3。

  - file:转换后的文件名。

  - sourceRoot:转换前的文件所在的目录。若是与转换前的文件在同一目录,该项为空。

  - sources:转换前的文件。该项是一个数组,表示可能存在多个文件合并。

  - names:转换前的全部变量名和属性名。

  - mappings:记录位置信息的字符串,下文详细介绍。

6、mappings属性

下面才是真正有趣的部分:两个文件的各个位置是如何一一对应的。

关键就是map文件的mappings属性。这是一个很长的字符串,它分红三层。

  第一层是行对应,以分号(;)表示,每一个分号对应转换后源码的一行。因此,第一个分号前的内容,就对应源码的第一行,以此类推。

  第二层是位置对应,以逗号(,)表示,每一个逗号对应转换后源码的一个位置。因此,第一个逗号前的内容,就对应该行源码的第一个位置,以此类推。

  第三层是位置转换,以VLQ编码表示,表明该位置对应的转换前的源码位置。

举例来讲,假定mappings属性的内容以下:

  mappings:"AAAAA,BBBBB;CCCCC"

就表示,转换后的源码分红两行,第一行有两个位置,第二行有一个位置。

7、位置对应的原理

每一个位置使用五位,表示五个字段。

从左边算起,

  - 第一位,表示这个位置在(转换后的代码的)的第几列。

  - 第二位,表示这个位置属于sources属性中的哪个文件。

  - 第三位,表示这个位置属于转换前代码的第几行。

  - 第四位,表示这个位置属于转换前代码的第几列。

  - 第五位,表示这个位置属于names属性中的哪个变量。

有几点须要说明。首先,全部的值都是以0做为基数的。其次,第五位不是必需的,若是该位置没有对应names属性中的变量,能够省略第五位。再次,每一位都采用VLQ编码表示;因为VLQ编码是变长的,因此每一位能够由多个字符构成。

若是某个位置是AAAAA,因为A在VLQ编码中表示0,所以这个位置的五个位实际上都是0。它的意思是,该位置在转换后代码的第0列,对应sources属性中第0个文件,属于转换前代码的第0行第0列,对应names属性中的第0个变量。

8、VLQ编码

最后,谈谈如何用VLQ编码表示数值。

这种编码最先用于MIDI文件,后来被多种格式采用。它的特色就是能够很是精简地表示很大的数值。

VLQ编码是变长的。若是(整)数值在-15到+15之间(含两个端点),用一个字符表示;超出这个范围,就须要用多个字符表示。它规定,每一个字符使用6个两进制位,正好能够借用Base 64编码的字符表。

在这6个位中,左边的第一位(最高位)表示是否"连续"(continuation)。若是是1,表明这6个位后面的6个位也属于同一个数;若是是0,表示该数值到这6个位结束。

  Continuation
  |     Sign
  |     |
  V     V
  101011

这6个位中的右边最后一位(最低位)的含义,取决于这6个位是不是某个数值的VLQ编码的第一个字符。若是是的,这个位表明"符号"(sign),0为正,1为负(Source map的符号固定为0);若是不是,这个位没有特殊含义,被算做数值的一部分。

9、VLQ编码:实例

下面看一个例子,如何对数值16进行VLQ编码。

  第一步,将16改写成二进制形式10000。

  第二步,在最右边补充符号位。由于16大于0,因此符号位为0,整个数变成100000。

  第三步,从右边的最低位开始,将整个数每隔5位,进行分段,即变成1和00000两段。若是最高位所在的段不足5位,则前面补0,所以两段变成00001和00000。

  第四步,将两段的顺序倒过来,即00000和00001。

  第五步,在每一段的最前面添加一个"连续位",除了最后一段为0,其余都为1,即变成100000和000001。

  第六步,将每一段转成Base 64编码。

查表可知,100000为g,000001为B。所以,数值16的VLQ编码为gB。上面的过程,看上去好像很复杂,作起来其实很简单,具体的实现请看官方的base64-vlq.js文件,里面有详细的注释。

10、参考连接

  - Introduction To JavaScript Source Maps
  - Source Map Revision 3 Proposal

(完)

相关文章
相关标签/搜索