前端工程与性能优化

分享自https://github.com/fouber/blog/issues/3javascript

每一个参与过开发企业级web应用的前端工程师或许都曾思考过前端性能优化方面的问题。咱们有雅虎14条性能优化原则,还有两本很经典的性能优化指导书:《高性能网站建设指南》、《高性能网站建设进阶指南》。经验丰富的工程师对于前端性能优化方法耳濡目染,基本都能一一列举出来。这些性能优化原则大概是在7年前提出的,对于web性能优化至今都有很是重要的指导意义。php

高性能网站建设指南

然而,对于构建大型web应用的团队来讲,要坚持贯彻这些优化原则并非一件十分容易的事。由于优化原则中不少要求是与工程管理相违背的,好比 把css放在头部 和 把js放在尾部 这两条原则,咱们不能让团队的工程师在写样式和脚本引用的时候都去修改一个相同的页面文件。这样作会严重影响团队成员间并行开发的效率,尤为是在团队有版本管理的状况下,天天要花大量的时间进行代码修改合并,这项成本是难以接受的。所以在前端工程界,总会看到周期性的性能优化工做,辛勤的前端工程师们每到月圆之夜就会倾巢出动根据优化原则作一次性能优化。css

性能优化是一个工程问题html

本文将从一个全新的视角来思考web性能优化与前端工程之间的关系,揭示前端性能优化在前端架构及开发工具设计层面的实现思路。前端

性能优化原则及分类

po主先假设本文的读者是有前端开发经验的工程师,并对企业级web应用开发及性能优化有必定的思考,所以我不会重复介绍雅虎14条性能优化原则。若是您没有这些前续知识,请移步 这里 来学习。java

首先,咱们把雅虎14条优化原则,《高性能网站建设指南》以及《高性能网站建设进阶指南》中提到的优化点作一次梳理,按照优化方向分类,能够获得这样一张表格:jquery

优化方向 优化手段
请求数量 合并脚本和样式表,CSS Sprites,拆分初始化负载,划分主域
请求带宽 开启GZip,精简JavaScript,移除重复脚本,图像优化
缓存利用 使用CDN,使用外部JavaScript和CSS,添加Expires头,
减小DNS查找,配置ETag,使AjaX可缓存
页面结构 将样式表放在顶部,将脚本放在底部,尽早刷新文档的输出
代码校验 避免CSS表达式,避免重定向

目前大多数前端团队能够利用 yui compressor 或者 google closure compiler 等压缩工具很容易作到 精简Javascript 这条原则;一样的,也可使用图片压缩工具对图像进行压缩,实现 图像优化 原则。这两条原则是对单个资源的处理,所以不会引发任何工程方面的问题。不少团队也经过引入代码校验流程来确保实现避免css表达式 和 避免重定向 原则。目前绝大多数互联网公司也已经开启了服务端的Gzip压缩,并使用CDN实现静态资源的缓存和快速访问;一些技术实力雄厚的前端团队甚至研发出了自动CSS Sprites工具,解决了CSS Sprites在工程维护方面的难题。使用“查找-替换”思路,咱们彷佛也能够很好的实现 划分主域 原则。git

咱们把以上这些已经成熟应用到实际生产中的优化手段去除掉,留下那些尚未很好实现的优化原则。再来回顾一下以前的性能优化分类:github

优化方向 优化手段
请求数量 合并脚本和样式表,拆分初始化负载
请求带宽 移除重复脚本
缓存利用 添加Expires头,配置ETag,使Ajax可缓存
页面结构 将样式表放在顶部,将脚本放在底部,尽早刷新文档的输出

有不少顶尖的前端团队能够将上述还剩下的优化原则也都一一解决,但业界大多数团队都还没能很好的解决这些问题。所以,本文将就这些原则的解决方案作进一步的分析与讲解,从而为那些尚未进入前端工业化开发的团队提供一些基础技术建设意见,也借此机会与业界顶尖的前端团队在工业化工程化方向上交流一下彼此的心得。web

静态资源版本更新与缓存

缓存利用 分类中保留了 添加Expires头 和 配置ETag 两项。或许有些人会质疑,明明这两项只要配置了服务器的相关选项就能够实现,为何说它们难以解决呢?确实,开启这两项很容易,但开启了缓存后,咱们的项目就开始面临另外一个挑战: 如何更新这些缓存?

相信大多数团队也找到了相似的答案,它和《高性能网站建设指南》关于“添加Expires头”所说的原则同样——修订文件名。即:

最有效的解决方案是修改其全部连接,这样,全新的请求将从原始服务器下载最新的内容。

思路没错,但要怎么改变连接呢?变成什么样的连接才能有效更新缓存,又能最大限度避免那些没有修改过的文件缓存不失效呢?

先来看看如今通常前端团队的作法:

<h1>hello world</h1>

<script type="text/javascript" src="a.js?t=201404231123"></script>
<script type="text/javascript" src="b.js?t=201404231123"></script>
<script type="text/javascript" src="c.js?t=201404231123"></script>
<script type="text/javascript" src="d.js?t=201404231123"></script>
<script type="text/javascript" src="e.js?t=201404231123"></script>

ps: 也有团队采用构建版本号为静态资源请求添加query,它们在本质上是没有区别的,在此就不赘述了。

接下来,项目升级,好比页面上的html结构发生变化,对应还要修改 a.js 这个文件,获得的构建结果以下:

<header>hello world</header>

<script type="text/javascript" src="a.js?t=201404231826"></script>
<script type="text/javascript" src="b.js?t=201404231826"></script>
<script type="text/javascript" src="c.js?t=201404231826"></script>
<script type="text/javascript" src="d.js?t=201404231826"></script>
<script type="text/javascript" src="e.js?t=201404231826"></script>

为了触发用户浏览器的缓存更新,咱们须要更改静态资源的url地址,若是采用构建信息(时间戳、版本号等)做为url修改的依据,如上述代码所示,咱们只修改了一个a.js文件,但再次构建会让全部请求都更改了url地址,用户再度访问页面那些没有修改过的静态资源的(b.js,b.js,c.js,d.js,e.js)的浏览器缓存也一同失效了。

使用构建信息做为静态资源更新标记会致使每次构建发布后全部静态资源都被迫更新,浏览器缓存利用率下降,给性能带来伤害。

此外,采用添加query的方式来清除缓存还有一个弊端,就是 覆盖式发布 的上线问题。

覆盖式发布

采用query更新缓存的方式实际上要覆盖线上文件的,index.html和a.js总有一个前后的顺序,从而中间出现一段或大或小的时间间隔。尤为是当页面是后端渲染的模板的时候,静态资源和模板是部署在不一样的机器集群上的,上线的过程当中,静态资源和页面文件的部署时间间隔可能会很是长,对于一个大型互联网应用来讲即便在一个很小的时间间隔内,都有可能出现新用户访问。在这个时间间隔中,访问了网站的用户会发生什么状况呢?

  1. 若是先覆盖index.html,后覆盖a.js,用户在这个时间间隙访问,会获得新的index.html配合旧的a.js的状况,从而出现错误的页面。
  2. 若是先覆盖a.js,后覆盖index.html,用户在这个间隙访问,会获得旧的index.html配合新的a.js的状况,从而也出现了错误的页面。

这就是为何大型web应用在版本上线的过程当中常常会较集中的出现前端报错日志的缘由,也是一些互联网公司选择加班到半夜等待访问低峰期再上线的缘由之一。

对于静态资源缓存更新的问题,目前来讲最优方案就是 基于文件内容的hash版本冗余机制 了。也就是说,咱们但愿项目源码是这么写的:

<script type="text/javascript" src="a.js"></script>

发布后代码变成

<script type="text/javascript" src="a_8244e91.js"></script>

也就是a.js发布出来后被修改了文件名,产生一个新文件,并非覆盖已有文件。其中”_82244e91”这串字符是根据a.js的文件内容进行hash运算获得的,只有文件内容发生变化了才会有更改。因为将文件发布为带有hash的新文件,而不是同名文件覆盖,所以不会出现上述说的那些问题。同时,这么作还有其余的好处:

  1. 上线的a.js不是同名文件覆盖,而是文件名+hash的冗余,因此能够先上线静态资源,再上线html页面,不存在间隙问题;
  2. 遇到问题回滚版本的时候,无需回滚a.js,只须回滚页面便可;
  3. 因为静态资源版本号是文件内容的hash,所以全部静态资源能够开启永久强缓存,只有更新了内容的文件才会缓存失效,缓存利用率大增;

以文件内容的hash值为依据生产新文件的非覆盖式发布策略是解决静态资源缓存更新最有效的手段。

虽然这种方案是相比之下最完美的解决方案,但它没法经过手工的形式来维护,由于要依靠手工的形式来计算和替换hash值,并生成相应的文件,将是一项很是繁琐且容易出错的工做,所以咱们须要借助工具来处理。

用grunt来实现md5功能是很是困难的,由于grunt只是一个task管理器,而md5计算须要构建工具具备递归编译的能,而不是简单的任务调度。考虑这样的例子:

md5计算过程

因为咱们的资源版本号是经过对文件内容进行hash运算获得,如上图所示,index.html中引用的a.css文件的内容其实也包含了a.png的hash运算结果,所以咱们在修改index.html中a.css的引用时,不能直接计算a.css的内容hash,而是要先计算出a.png的内容hash,替换a.css中的引用,获得了a.css的最终内容,再作hash运算,最后替换index.html中的引用。

计算index.html中引用的a.css文件的url过程:
1. 压缩a.png后计算其内容的md5值
2. 将a.png的md5写入a.css,再压缩a.css,计算其内容的md5值
3. 将a.css的md5值写入到index.html中

grunt等task-based的工具是很难在task之间协做处理这样的需求的。

在解决了基于内容hash的版本更新问题以后,咱们能够将全部前端静态资源开启永久强缓存,每次版本发布均可以首先让静态资源全量上线,再进一步上线模板或者页面文件,不再用担忧各类缓存和时间间隙的问题了!

静态资源管理与模块化框架

解决了静态资源缓存问题以后,让咱们再来看看前面的优化原则表还剩些什么:

优化方向 优化手段
请求数量 合并脚本和样式表,拆分初始化负载
请求带宽 移除重复脚本
缓存利用 使Ajax可缓存
页面结构 将样式表放在顶部,将脚本放在底部,尽早刷新文档的输出

很不幸,剩下的优化原则都不是使用工具就能很好实现的。或许有人会辩驳:“我用某某工具能够实现脚本和样式表合并”。嗯,必须认可,使用工具进行资源合并并替换引用或许是一个不错的办法,但在大型web应用,这种方式有一些很是严重的缺陷,来看一个很熟悉的例子 :

第一天

某个web产品页面有A、B、C三个资源

次日

工程师根据“减小HTTP请求”的优化原则合并了资源

第三天

产品经理要求C模块按需出现,此时C资源已出现多余的可能

第四天

C模块再也不须要了,注释掉吧!代码1秒钟搞定,但C资源一般不敢轻易剔除

后来

不知不觉中,性能优化变成了性能恶化……

这个例子来自 Facebook静态网页资源的管理和优化@Velocity China 2010

事实上,使用工具在线下进行静态资源合并是没法解决资源按需加载的问题的。若是解决不了按需加载,则必会致使资源的冗余;此外,线下经过工具实现的资源合并一般会使得资源加载和使用的分离,好比在页面头部或配置文件中写资源引用及合并信息,而用到这些资源的html组件写在了页面其余地方,这种书写方式在工程上很是容易引发维护不一样步的问题,致使使用资源的代码删除了,引用资源的代码却还在的状况。所以,在工业上要实现资源合并至少要知足以下需求:

  1. 确实能减小HTTP请求,这是基本要求(合并)
  2. 在使用资源的地方引用资源(就近依赖),不使用不加载(按需)
  3. 虽然资源引用不是集中书写的,但资源引用的代码最终还能出如今页面头部(css)或尾部(js)
  4. 可以避免重复加载资源(去重)

将以上要求综合考虑,不难发现,单纯依靠前端技术或者工具处理是很难达到这些理想要求的。

接下来我会讲述一种新的模板架构设计,用以实现前面说到那些性能优化原则,同时知足工程开发和维护的须要,这种架构设计的核心思想就是:

基于依赖关系表的静态资源管理系统与模块化框架设计

考虑一段这样的页面代码:

<html>
<head>
    <title>page</title>
    <link rel="stylesheet" type="text/css" href="a.css"/>
    <link rel="stylesheet" type="text/css" href="b.css"/>
    <link rel="stylesheet" type="text/css" href="c.css"/>
</head>
<body>
    <div> content of module a </div>
    <div> content of module b </div>
    <div> content of module c </div>
</body>
</html>

根据资源合并需求中的第二项,咱们但愿资源引用与使用能尽可能靠近,这样未来维护起来会更容易一些,所以,理想的源码是:

<html>
<head>
    <title>page</title>
</head>
<body>
    <link rel="stylesheet" type="text/css" href="a.css"/>
    <div> content of module a </div>

    <link rel="stylesheet" type="text/css" href="b.css"/>
    <div> content of module b </div>

    <link rel="stylesheet" type="text/css" href="c.css"/>
    <div> content of module c </div>
</body>
</html>

固然,把这样的页面直接送达给浏览器用户是会有严重的页面闪烁问题的,因此咱们实际上仍然但愿最终页面输出的结果仍是如最开始的截图同样,将css放在头部输出。这就意味着,页面结构须要有一些调整,而且有能力收集资源加载需求,那么咱们考虑一下这样的源码(以php为例):

<html>
<head>
    <title>page</title>
    <!--[ CSS LINKS PLACEHOLDER ]-->
</head>
<body>
    <?php require_static('a.css'); ?>
    <div> content of module a </div>

    <?php require_static('b.css'); ?>
    <div> content of module b </div>

    <?php require_static('c.css'); ?>
    <div> content of module c </div>
</body>
</html>

在页面的头部插入一个html注释 <!--[CSS LINKS PLACEHOLDER]--> 做为占位,而将原来字面书写的资源引用改为模板接口 require_static 调用,该接口负责收集页面所需资源。

require_static接口实现很是简单,就是准备一个数组,收集资源引用,而且能够去重。最后在页面输出的前一刻,咱们将require_static在运行时收集到的 a.cssb.cssc.css 三个资源拼接成html标签,替换掉注释占位 <!--[CSS LINKS PLACEHOLDER]-->,从而获得咱们须要的页面结构。

通过实践总结,能够发现模板层面只要实现三个开发接口,就能够比较完美的实现目前遗留的大部分性能优化原则,这三个接口分别是:

  1. require_static(res_id):收集资源加载需求的接口,参数是静态资源id。
  2. load_widget(wiget_id):加载拆分红小组件模板的接口。你能够叫它为widget、component或者pagelet之类的。总之,咱们须要一个接口把一个大的页面模板拆分红一个个的小部分来维护,最后在原来的页面中以组件为单位来加载这些小部件。
  3. script(code):收集写在模板中的js脚本,使之出现的页面底部,从而实现性能优化原则中的 将js放在页面底部 原则。

实现了这些接口以后,一个重构后的模板页面的源代码可能看起来就是这样的了:

<html>
<head>
    <title>page</title>
    <?php require_static('jquery.js'); ?>
    <?php require_static('bootstrap.css'); ?>
    <?php require_static('bootstrap.js'); ?>
    <!--[ CSS LINKS PLACEHOLDER ]-->
</head>
<body>
    <?php load_widget('a'); ?>
    <?php load_widget('b'); ?>
    <?php load_widget('c'); ?>
    <!--[ SCRIPTS PLACEHOLDER ]-->
</body>
</html>

而最终在模板解析的过程当中,资源收集与去重、页面script收集、占位符替换操做,最终从服务端发送出来的html代码为:

<html>
<head>
    <title>page</title>
    <link rel="stylesheet" type="text/css" href="bootstrap.css"/>
    <link rel="stylesheet" type="text/css" href="a.css"/>
    <link rel="stylesheet" type="text/css" href="b.css"/>
    <link rel="stylesheet" type="text/css" href="c.css"/>
</head>
<body>
    <div> content of module a </div>
    <div> content of module b </div>
    <div> content of module c </div>
    <script type="text/javascript" src="jquery.js"></script>
    <script type="text/javascript" src="bootstrap.js"></script>
    <script type="text/javascript" src="a.js"></script>
    <script type="text/javascript" src="b.js"></script>
    <script type="text/javascript" src="c.js"></script>
</body>
</html>

不难看出,咱们目前已经实现了 按需加载将脚本放在底部将样式表放在头部 三项优化原则。

前面讲到静态资源在上线后须要添加hash戳做为版本标识,那么这种使用模板语言来收集的静态资源该如何实现这项功能呢?

答案是:静态资源依赖关系表。

考虑这样的目录结构:

project
    ├── widget
    │   ├── a
    │   │   ├── a.css
    │   │   ├── a.js
    │   │   └── a.php
    │   ├── b
    │   │   ├── b.css
    │   │   ├── b.js
    │   │   └── b.php
    │   └── c
    │       ├── c.css
    │       ├── c.js
    │       └── c.php
    ├── bootstrap.css
    ├── bootstrap.js
    ├── index.php
    └── jquery.js

若是咱们可使用工具扫描整个project目录,而后建立一张资源表,同时记录每一个资源的部署路径,获得这样的一张表:

{
    "res" : {
        "widget/a/a.css" : "/widget/a/a_1688c82.css",
        "widget/a/a.js"  : "/widget/a/a_ac3123s.js",
        "widget/b/b.css" : "/widget/b/b_52923ed.css",
        "widget/b/b.js"  : "/widget/b/b_a5cd123.js",
        "widget/c/c.css" : "/widget/c/c_03cab13.css",
        "widget/c/c.js"  : "/widget/c/c_bf0ae3f.js",
        "jquery.js"      : "/jquery_9151577.js",
        "bootstrap.css"  : "/bootstrap_f5ba12d.css",
        "bootstrap.js"   : "/bootstrap_a0b3ef9.js"
    },
    "pkg" : {}
}

基于这张表,咱们就很容易实现 require_static(file_id)load_widget(widget_id) 这两个模板接口了。以load_widget为例:

function load_widget($id){
    //从json文件中读取资源表
    $map = load_map();
    //查找静态资源
    $filename = 'widget/' . $id . '/' . $id;
    //查找js文件
    $js = $filename . '.js';
    if(isset($map['res'][$js])) {
        //若是有对应的js资源,就收集起来
        collect_js_static($map['res'][$js]);
    }
    //查找css文件
    $css = $filename . '.css';
    if(isset($map['res'][$css])) {
        //若是有对应的css资源,就收集起来
        collect_css_static($map['res'][$css]);
    }
    include $filename . '.php';
}

利用查表来解决md5戳的问题,这样,咱们的页面最终送达给用户的结果就是这样的:

<html>
<head>
    <title>page</title>
    <link rel="stylesheet" type="text/css" href="/bootstrap_f5ba12d.css"/>
    <link rel="stylesheet" type="text/css" href="/widget/a/a_1688c82.css"/>
    <link rel="stylesheet" type="text/css" href="/widget/b/b_52923ed.css"/>
    <link rel="stylesheet" type="text/css" href="/widget/c/c_03cab13.css"/>
</head>
<body>
    <div> content of module a </div>
    <div> content of module b </div>
    <div> content of module c </div>
    <script type="text/javascript" src="/jquery_9151577.js"></script>
    <script type="text/javascript" src="/bootstrap_a0b3ef9.js"></script>
    <script type="text/javascript" src="/widget/a/a_ac3123s.js"></script>
    <script type="text/javascript" src="/widget/b/b_a5cd123.js"></script>
    <script type="text/javascript" src="/widget/c/c_bf0ae3f.js"></script>
</body>
</html>

接下来,咱们讨论基于表的设计思想上是如何实现静态资源合并的。或许有些团队使用过combo服务,也就是咱们在最终拼接生成页面资源引用的时候,并非生成多个独立的link标签,而是将资源地址拼接成一个url路径,请求一种线上的动态资源合并服务,从而实现减小HTTP请求的需求,好比前面的例子,稍做调整便可获得这样的结果:

<html>
<head>
    <title>page</title>
    <link rel="stylesheet" type="text/css" href="/??bootstrap_f5ba12d.css,widget/a/a_1688c82.css,widget/b/b_52923ed.css,widget/c/c_03cab13.css"/>
</head>
<body>
    <div> content of module a </div>
    <div> content of module b </div>
    <div> content of module c </div>
    <script type="text/javascript" src="/??jquery_9151577.js,bootstrap_a0b3ef9.js,widget/a/a_ac3123s.js,widget/b/b_a5cd123.js,widget/c/c_bf0ae3f.js"></script>
</body>
</html>

这个 /??file1,file2,file3,… 的url请求响应就是动态combo服务提供的,它的原理很简单,就是根据url找到对应的多个文件,合并成一个文件来响应请求,并将其缓存,以加快访问速度。

这种方法很巧妙,有些服务器甚至直接集成了这类模块来方便的开启此项服务,这种作法也是大多数大型web应用的资源合并作法。但它也存在一些缺陷:

  1. 浏览器有url长度限制,所以不能无限制的合并资源。
  2. 若是用户在网站内有公共资源的两个页面间跳转访问,因为两个页面的combo的url不同致使用户不能利用浏览器缓存来加快对公共资源的访问速度。
  3. 若是combo的url中任何一个文件发生改变,都会致使整个url缓存失效,从而致使浏览器缓存利用率下降。

对于上述第二条缺陷,能够举个例子来看说明:

  • 假设网站有两个页面A和B
  • A页面使用了a,b,c,d四个资源
  • B页面使用了a,b,e,f四个资源
  • 若是使用combo服务,咱们会得:
    • A页面的资源引用为:/??a,b,c,d
    • B页面的资源引用为:/??a,b,e,f
  • 两个页面引用的资源是不一样的url,所以浏览器会请求两个合并后的资源文件,跨页面访问没能很好的利用a、b这两个资源的缓存。

很明显,若是combo服务能聪明的知道A页面使用的资源引用为 /??a,b 和 /??c,d,而B页面使用的资源引用为 /??a,b 和 /??e,f就行了。这样当用户在访问A页面以后再访问B页面时,只须要下载B页面的第二个combo文件便可,第一个文件已经在访问A页面时缓存好了的。

基于这样的思考,咱们在资源表上新增了一个字段,取名为 pkg,就是资源合并生成的新资源,表的结构会变成:

{
    "res" : {
        "widget/a/a.css" : "/widget/a/a_1688c82.css",
        "widget/a/a.js"  : "/widget/a/a_ac3123s.js",
        "widget/b/b.css" : "/widget/b/b_52923ed.css",
        "widget/b/b.js"  : "/widget/b/b_a5cd123.js",
        "widget/c/c.css" : "/widget/c/c_03cab13.css",
        "widget/c/c.js"  : "/widget/c/c_bf0ae3f.js",
        "jquery.js"      : "/jquery_9151577.js",
        "bootstrap.css"  : "/bootstrap_f5ba12d.css",
        "bootstrap.js"   : "/bootstrap_a0b3ef9.js"
    },
    "pkg" : {
        "p0" : {
            "url" : "/pkg/lib_cef213d.js",
            "has" : [ "jquery.js", "bootstrap.js" ]
        },
        "p1" : {
            "url" : "/pkg/lib_afec33f.css",
            "has" : [ "bootstrap.css" ]
        },
        "p2" : {
            "url" : "/pkg/widgets_22feac1.js",
            "has" : [
                "widget/a/a.js",
                "widget/b/b.js",
                "widget/c/c.js"
            ]
        },
        "p3" : {
            "url" : "/pkg/widgets_af23ce5.css",
            "has" : [
                "widget/a/a.css",
                "widget/b/b.css",
                "widget/c/c.css"
            ]
        }
    }
}

相比以前的表,能够看到新表中多了一个pkg字段,而且记录了打包后的文件所包含的独立资源。这样,咱们从新设计一下 require_static、load_widget 这两个模板接口,实现这样的逻辑:

在查表的时候,若是一个静态资源有pkg字段,那么就去加载pkg字段所指向的打包文件,不然加载资源自己。

好比执行require_static('bootstrap.js'),查表得知bootstrap.js被打包在了p1中,所以取出p1包的url/pkg/lib_cef213d.js,而且记录页面已加载了 jquery.js 和 bootstrap.js 两个资源。这样一来,以前的模板代码执行以后获得的html就变成了:

<html>
<head>
    <title>page</title>
    <link rel="stylesheet" type="text/css" href="/pkg/lib_afec33f.css"/>
    <link rel="stylesheet" type="text/css" href="/pkg/widgets_af23ce5.css"/>
</head>
<body>
    <div> content of module a </div>
    <div> content of module b </div>
    <div> content of module c </div>
    <script type="text/javascript" src="/pkg/lib_cef213d.js"></script>
    <script type="text/javascript" src="/pkg/widgets_22feac1.js"></script>
</body>
</html>

虽然这种策略请求有4个,不如combo形式的请求少,但可能在统计上是性能更好的方案。因为两个lib打包的文件修改的可能性很小,所以这两个请求的缓存利用率会很是高,每次项目发布后,用户须要从新下载的静态资源可能要比combo请求节省不少带宽。

性能优化既是一个工程问题,又是一个统计问题。优化性能时若是只关注一个页面的首次加载是很片面的。还应该考虑全站页面间跳转、项目迭代后更新资源等状况下的优化策略。

此时,咱们又引入了一个新的问题:如何决定哪些文件被打包?

从经验来看,项目初期能够采用人工配置的方式来指定打包状况,好比:

{
    "pack" : {
        "lib.js"      : [ "jquery.js", "bootstrap.js" ],
        "lib.css"     : "bootstrap.css",
        "widgets.js"  : "widget/**.js",
        "widgets.css" : "widget/**.css"
    }
}

但随着系统规模的增大,人工配置会带来很是高的维护成本,此时须要一个辅助系统,经过分析线上访问日志和静态资源组合加载状况来自动生成这份配置文件,系统设计如图:

静态资源分析系统

至此,咱们经过基于表的静态资源管理系统和三个模板接口实现了几个重要的性能优化原则,如今咱们再来回顾一下前面的性能优化原则分类表,剔除掉已经作到了的,看看还剩下哪些没作到的:

优化方向 优化手段
请求数量 拆分初始化负载
缓存利用 使Ajax可缓存
页面结构 尽早刷新文档的输出

拆分初始化负载 的目标是将页面一开始加载时不须要执行的资源从全部资源中分离出来,等到须要的时候再加载。工程师一般没有耐心去区分资源的分类状况,但咱们能够利用组件化框架接口来帮助工程师管理资源的使用。仍是从例子开始思考,若是咱们有一个js文件是用户交互后才须要加载的,会怎样呢:

<html>
<head>
    <title>page</title>
    <?php require_static('jquery.js'); ?>
    <?php require_static('bootstrap.css'); ?>
    <?php require_static('bootstrap.js'); ?>
    <!--[ CSS LINKS PLACEHOLDER ]-->
</head>
<body>
    <?php load_widget('a'); ?>
    <?php load_widget('b'); ?>
    <?php load_widget('c'); ?>

    <?php script('start'); ?>
    <script>
        $(document.body).click(function(){
            require.async('dialog.js', function(dialog){
                dialog.show('you catch me!');
            });
        });
    </script>
    <?php script('end'); ?>

    <!--[ SCRIPTS PLACEHOLDER ]-->
</body>
</html>

很明显,dialog.js 这个文件咱们不须要在初始化的时候就加载,所以它应该在后续的交互中再加载,但文件都加了md5戳,咱们如何能在浏览器环境中知道加载的url呢?

答案就是:把静态资源表的一部分输出在页面上,供前端模块化框架加载静态资源。

我就很少解释代码的执行过程了,你们看到完整的html输出就能理解是怎么回事了:

<html>
<head>
    <title>page</title>
    <link rel="stylesheet" type="text/css" href="/pkg/lib_afec33f.css"/>
    <link rel="stylesheet" type="text/css" href="/pkg/widgets_af23ce5.css"/>
</head>
<body>
    <div> content of module a </div>
    <div> content of module b </div>
    <div> content of module c </div>
    <script type="text/javascript" src="/pkg/lib_cef213d.js"></script>
    <script type="text/javascript" src="/pkg/widgets_22feac1.js"></script>
    <script>
        //将静态资源表输出在前端页面中
        require.config({
            res : {
                'dialog.js' : '/dialog_fa3df03.js'
            }
        });
    </script>
    <script>
        $(document.body).click(function(){
            //require.async接口查表肯定加载资源的url
            require.async('dialog.js', function(dialog){
                dialog.show('you catch me!');
            });
        });
    </script>
</body>
</html>

dialog.js不会在页面以script src的形式输出,而是变成了资源注册,这样,当页面点击触发require.async执行的时候,async函数才会查表找到资源的url并加载它,加载完毕后触发回调函数。

以上框架示例我实现了一个java-jsp版的,有兴趣的同窗请看这里:https://github.com/fouber/fis-java-jsp

到目前为止,咱们又以架构的形式实现了一项优化原则(拆分初始化负载),回顾咱们的优化分类表,如今仅有两项没能作到了:

优化方向 优化手段
缓存利用 使Ajax可缓存
页面结构 尽早刷新文档的输出

剩下的两项优化原则要作到并不容易,真正可缓存的Ajax在现实开发中比较少见,而 尽早刷新文档的输出 原则facebook在2010年的velocity上 提到过,就是BigPipe技术。当时facebook团队还讲到了Quickling和PageCache两项技术,其中的PageCache算是比较完全的实现Ajax可缓存的优化原则了。因为篇幅关系,就不在此展开了,后续还会撰文详细解读这两项技术。

总结

其实在前端开发工程管理领域还有不少细节值得探索和挖掘,提高前端团队生产力水平并非一句空话,它须要咱们能对前端开发及代码运行有更深入的认识,对性能优化原则有更细致的分析与研究。在前端工业化开发的全部环节均有可节省的人力成本,这些成本很是可观,相信如今不少大型互联网公司也都有了这样的共识。

本文只是将这个领域中很小的一部分知识的展开讨论,抛砖引玉,但愿能为业界相关领域的工做者提供一些不同的思路。

相关文章
相关标签/搜索