前端面试常问第二大问题是http缓存
相关内容。说真的,http缓存相关的细节比较多,而且 http 经常使用协议版本有1.0、1.1,(本文暂不讨论http2.0)。javascript
咱们先罗列一下和缓存相关的请求响应头。css
响应头,表明该资源的过时时间。html
请求/响应头,缓存控制字段,精确控制缓存策略。前端
请求头,资源最近修改时间,由浏览器告诉服务器。java
响应头,资源最近修改时间,由服务器告诉浏览器。webpack
响应头,资源标识,由服务器告诉浏览器。web
请求头,缓存资源标识,由浏览器告诉服务器。面试
配对使用的字段:浏览器
今天着重介绍一下浏览器缓存机制,咱们知道,浏览器缓存通常都是针对静态资源,好比 js、css、图片 等,因此咱们下面的例子围绕一个 javascript 文件 a.js 来阐述。抛开理论式灌输,咱们从实际场景触发,一点点完善缓存机制,这种方式,相信你们会更容易理解。缓存
作一些约定,方便之后比较。
执行一个往返,流量为 10(a.js)+1(请求头)+1(响应头) = 12KB。
访问 10 次,流量大约为12 * 10 = 120KB。
因此,流量与访问次数有关:
L(流量) = N(访问次数) * 12。
该方式缺点很明显:
js 执行时间相比下载时间要快的多,若是能优化下载时间,用户体验会提高不少。
第一次访问,流量为 1+10+1 = 12KB。 第二次访问,流量为 0。 。。。 第 10000 次访问,流量依然为 0。
因此流量与访问次数无关:
L(流量) = 12KB。
优势:
缺点:服务器上 a.js 更新时,浏览器感知不到,拿不到最新的 js 资源。
服务器和浏览器约定文件过时时间,用 Expires 字段来控制,时间是 GMT 格式的标准时间,如 Fri, 01 Jan 1990 00:00:00 GMT。
服务器告诉浏览器:你把我发给你的 a.js 文件缓存到你那里,在 2018年9月26日5点以前不要再发请求烦我,直接使用你本身缓存的 a.js 就好了。
该种方式较以前的方式有了很大的改善:
缺点仍是有:
为了解决上个方案的问题,服务器和浏览器通过磋商,制定了一种方案,服务器每次返回 a.js 的时候,还要告诉浏览器 a.js 在服务器上的最近修改时间 Last-Modified (GMT标准格式)。
浏览器访问 a.js 文件。(1KB)
服务器返回 a.js 的时候,告诉浏览器 a.js 文件。(10+1=11KB) 在服务器的上次修改时间 Last-Modified(GMT标准格式)以及缓存过时时间 Expires(GMT标准格式)
当 a.js 过时时,浏览器带上 If-Modified-Since(等于上一次请求的Last-Modified) 请求服务器。(1KB)
服务器比较请求头里的 Last-Modified 时间和服务器上 a.js的上次修改时间:
此种方案比上一个方案有了更进一步的优化:
缺点:
精确到秒存在两个问题:
为了兼容已经实现了上述方案的浏览器,同时加入新的缓存方案,服务器除了告诉浏览器 Expires ,同时告诉浏览器一个相对时间 Cache-Control:max-age=10秒。意思是在10秒之内,使用缓存到浏览器的 a.js 资源。
浏览器先检查 Cache-Control,若是有,则以 Cache-Control 为准,忽略 Expires。若是没有 Cache-Control,则以 Expires 为准。
为了解决文件修改时间只能精确到秒带来的问题,咱们给服务器引入 Etag 响应头,a.js 内容变了,Etag 才变。内容不变,Etag 不变,能够理解为 Etag 是文件内容的惟一 ID。 同时引入对应的请求头 If-None-Match,每次浏览器请求服务器的时候,都带上If-None-Match字段,该字段的值就是上次请求 a.js 时,服务器返回给浏览器的 Etag。
到此就结束了吗? 是的,http的缓存机制就是如此了,可是仍然存在一个问题:
浏览器没法主动得知服务器上的 a.js 资源变化了。
无论用 Expires 仍是 Cache-Control,他们都只可以控制缓存是否过时,可是在缓存过时以前,浏览器是没法得知服务器上的资源是否变化的。只有当缓存过时后,浏览器才会发请求询问服务器。
你们能够想象咱们使用 a.js 的场景,咱们通常都是输入网址,访问一个 html 文件,html文件中会引入 js、css 、图片等资源。
因此呢,咱们在html上作些手脚。
咱们不让 html 文件缓存,每次访问 html 都去请求服务器。因此浏览器每次都能拿到最新的html资源。
a.js 内容更新的时候,咱们修改一下 html 中 a.js 的版本号。
<script src="http://test.com/a.js?version=0.0.1"></script>
复制代码
浏览器下载0.0.1版本的a.js文件。
浏览器再次访问 html,发现仍是0.0.1版本的a.js文件,则使用本地缓存。
某一天a.js变了,咱们的html文件也相应变化以下:
<script src="http://test.com/a.js?version=0.0.2"></script>
复制代码
因此,经过设置html不缓存,html引用资源内容变化则改变资源路径的方式,就解决了没法及时得知资源更新的问题。
固然除了以版本号来区分,也能够以 MD5hash 值来区分。 如
<script src="http://test.com/a.【hash值】.js"></script>
复制代码
使用webpack打包的话,借助插件能够很方便的处理。
Cache-Control 除了能够设置 max-age 相对过时时间之外,还能够设置成以下几种值:
浏览器请求服务器时,若是缓存时间没到,中间服务器直接返回给浏览器内容,而没必要请求源服务器。
浏览器请求服务器时,中间服务器都要把浏览器的请求透传给服务器。
每次访问资源,浏览器都要向服务器询问,若是文件没变化,服务器只告诉浏览器继续使用缓存(304)。
每次访问资源,浏览器都必须请求服务器,而且,服务器不去检查文件是否变化,而是直接返回完整的资源。
Cache-Control 对缓存的控制粒度更细,包括缓存代理服务器的缓存控制。
文章介绍到此,若有兴趣,能够动手实践下。