HTML5离线存储原理

前言:

使用HTML5,经过建立cache manifest文件,可轻松建立web应用的离线版本。
HTML5引入了应用程序缓存,这意味着web应用可进行缓存,并可在没有网络时进行访问。
应用程序缓存为应用带来三个优点:javascript

  • 离线浏览--用户可在离线时使用它们。css

  • 速度--已经缓存的资源加载得更快。html

  • 减小服务器负载--浏览器将只从服务器下载更改过的资源。html5

原理和环境

如上面提到的HTML5的离线存储是基于一个新建的.appcache文件的,经过这个文件上的解析清单离线存储资源,这些资源就会像cookie同样被存储了下来。以后当网络在处于离线状态下时,浏览器会经过被离线存储的数据进行页面展现。java

就像cookie同样,html5的离线存储也须要服务器环境。web

解析清单

在开始以前要先了解下manifest(即.appcache文件),上面的解析清单要怎么写。浏览器

manifest 文件是简单的文本文件,它告知浏览器被缓存的内容(以及不缓存的内容)。
manifest 文件可分为三个部分:缓存

  • CACHE MANIFEST - 在此标题下列出的文件将在首次下载后进行缓存服务器

  • NETWORK - 在此标题下列出的文件须要与服务器的链接,且不会被缓存cookie

  • FALLBACK - 在此标题下列出的文件规定当页面没法访问时的回退页面(好比 404 页面)
    在线的状况下,用户代理每次访问页面,都会去读一次manifest.若是发现其改变, 则从新加载所有清单中的资源。

CACHE MANIFEST

第一行,CACHE MANIFEST,是必需的:

1 CACHE MANIFEST /theme.css /logo.gif /main.js

上面的 manifest 文件列出了三个资源:一个 CSS 文件,一个 GIF 图像,以及一个 JavaScript 文件。当 manifest 文件加载后,浏览器会从网站的根目录下载这三个文件。而后,不管用户什么时候与因特网断开链接,这些资源依然是可用的。

NETWORK

白名单,使用通配符”*”. 则会进入白名单的open状态. 这种状态下.全部不在相关Cache区域出现的url都默认使用HTTP相关缓存头策略.

下面的 NETWORK 小节规定文件 “login.asp” 永远不会被缓存,且离线时是不可用的:

NETWORK: login.asp

可使用*来指示全部其余资源/文件都须要因特网链接:

NETWORK: *

FALLBACK

下面的 FALLBACK 小节规定若是没法创建因特网链接,则用 “offline.html” 替代 /html5/ 目录中的全部文件:

ALLBACK:/html5/ /404.html

注释:第一个 URI 是资源,第二个是替补。

更新缓存

一旦应用被缓存,它就会保持缓存直到发生下列状况:

  • 用户清空浏览器缓存

  • manifest 文件被修改

  • 由程序来更新应用缓存

Demo

|-- index.html 
|-- demo.appcache 
|-- image 
    |-- 01.jpg 
    |-- 02.jpg

index.html

<!DOCTYPE html> 
<html lang="en" manifest="demo.appcache"> 
<head> 
    <meta charset="UTF-8"> 
    <title>HTML5离线存储</title>
</head> 
<body> 
    <img src="image/01.jpg" alt=""> 
    <img src="image/02.jpg" alt=""> 
</body> 
</html>

demo.appcache

CACHE MANIFEST #v01 image/01.jpg
NETWORK: *
FALLBACK: /

image文件夹下存储着

01.jpg

01.jpg

02.jpg

02.jpg

当服务器开启时

当服务器关闭时(是关闭,暂停看不出效果)

能够看见图片1成功被离线展现出来了,图片2像正常状况同样显示不出来。

如今我想把图片2图片1的位置换一下呢.

<body> 
    <img src="image/02.jpg" alt=""> 
    <img src="image/01.jpg" alt=""> 
</body>

这时候发现问题来了,html明明修改了为何图片没有置换过来呢,我不是在demo.appcache文件的NETWORK写了星号吗?除了CACHE MANIFEST文件其它都采用在线模式。查资料得知:引入manifest的页面,即便没有被列入缓存清单中,仍然会被用户代理缓存。
好吧,那我把.appcache文件更新下,因而乎把头部的版本号修改一下#v02。刷新下页面仍是没反应!再刷新,有了!为何?

对于浏览器来讲,manifest的加载是要晚于其余资源的. 这就致使check manifest的过程是滞后的.发现manifest改变.全部浏览器的实现都是紧随这作静默更新资源.以保证下次pv,应用到更新.

经过控制台咱们可以窥探一二:

第一次刷新,应用程序缓存更新准备事件

第二次刷新才会看到效果。

缓存当即执行

咱们的产品已经更新了用户却要第二次进来才可以看到,这样用户体验也太差了吧,有什么方式可以解决呢?好在html5给javascript提供了相关的API。

API篇幅太多自行查看把,这里我晒下我测试成功的code:

/*code1,简单粗暴的*/
applicationCache.onupdateready = function(){
    applicationCache.swapCache();
    location.reload();
};
/*code2,缓存公用方法*/
var EventUtil = {
    addHandler: function(element, type, handler) {
        if (element.addEventListener) {
            element.addEventListener(type, handler, false);
        } else if (element.attachEvent) {
            element.attachEvent(“on” + type, handler);
        } else {
            element["on" + type] = handler;
        }
    }
};
EventUtil.addHandler(applicationCache, “updateready”, function() { 
    //缓存更新并已下载,要在下次进入页面生效
    //检查缓存manifest文件是否更新,ps:页面加载默认检查一次。
    applicationCache.update(); 
    //交换到新的缓存项中,交换了要下次进入页面才生效
    applicationCache.swapCache(); 
    
    location.reload(); //从新载入页面
});

code1通常用在页面加载时直接触发,而code2的方式可后期检查更新。

注意事项

  • 站点离线存储的容量限制是5M

  • 若是manifest文件,或者内部列举的某一个文件不能正常下载,整个更新过程将视为失败,浏览器继续所有使用老的缓存

  • 引用manifest的html必须与manifest文件同源,在同一个域下

  • 在manifest中使用的相对路径,相对参照物为manifest文件

  • CACHE MANIFEST字符串应在第一行,且必不可少

  • 系统会自动缓存引用清单文件的 HTML 文件

  • manifest文件中CACHE则与NETWORK,FALLBACK的位置顺序没有关系,若是是隐式声明须要在最前面

  • FALLBACK中的资源必须和manifest文件同源

  • 当一个资源被缓存后,该浏览器直接请求这个绝对路径也会访问缓存中的资源。

  • 站点中的其余页面即便没有设置manifest属性,请求的资源若是在缓存中也从缓存中访问

  • 当manifest文件发生改变时,资源请求自己也会触发更新

转载自:http://www.codeceo.com