缓存,这是一个老生常谈的话题,也常被做为前端面试的一个知识点。css
本文,重点在与探讨在实际项目中,如何进行缓存的设置,并给出一个较为合理的方案。html
在介绍缓存的时候,咱们习惯将缓存分为强缓存和协商缓存两种。二者的主要区别是使用本地缓存的时候,是否须要向服务器验证本地缓存是否依旧有效。顾名思义,协商缓存,就是须要和服务器进行协商,最终肯定是否使用本地缓存。前端
咱们知道,强缓存主要是经过http请求头中的Cache-Control和Expire两个字段控制。Expire是HTTP1.0标准下的字段,在这里咱们能够忽略。咱们重点来讨论的Cache-Control这个字段。node
通常,咱们会设置Cache-Control的值为“public, max-age=xxx”,表示在xxx秒内再次访问该资源,均使用本地的缓存,再也不向服务器发起请求。react
显而易见,若是在xxx秒内,服务器上面的资源更新了,客户端在没有强制刷新的状况下,看到的内容仍是旧的。若是说你不着急,能够接受这样的,那是否是完美?然而,不少时候不是你想的那么简单的,若是发布新版本的时候,后台接口也同步更新了,那就gg了。有缓存的用户还在使用旧接口,而那个接口已经被后台干掉了。怎么办?webpack
协商缓存最大的问题就是每次都要向服务器验证一下缓存的有效性,彷佛看起来很省事,无论那么多,你都要问一下我是否有效。可是,对于一个有追求的码农,这是不能接受的。每次都去请求服务器,那要缓存还有什么意义。git
缓存的意义就在于减小请求,更多地使用本地的资源,给用户更好的体验的同时,也减轻服务器压力。因此,最佳实践,就应该是尽量命中强缓存,同时,能在更新版本的时候让客户端的缓存失效。github
在更新版本以后,如何让用户第一时间使用最新的资源文件呢?机智的前端们想出了一个方法,在更新版本的时候,顺便把静态资源的路径改了,这样,就至关于第一次访问这些资源,就不会存在缓存的问题了。web
伟大的webpack可让咱们在打包的时候,在文件的命名上带上hash值。面试
entry:{
main: path.join(__dirname,'./main.js'),
vendor: ['react', 'antd']
},
output:{
path:path.join(__dirname,'./dist'),
publicPath: '/dist/',
filname: 'bundle.[chunkhash].js'
}
复制代码
综上所述,咱们能够得出一个较为合理的缓存方案:
webpack给咱们提供了三种哈希值计算方式,分别是hash、chunkhash和contenthash。那么这三者有什么区别呢?
显然,咱们是不会使用第一种的。改了一个文件,打包以后,其余文件的hash都变了,缓存天然都失效了。这不是咱们想要的。
那chunkhash和contenthash的主要应用场景是什么呢?在实际在项目中,咱们通常会把项目中的css都抽离出对应的css文件来加以引用。若是咱们使用chunkhash,当咱们改了css代码以后,会发现css文件hash值改变的同时,js文件的hash值也会改变。这时候,contenthash就派上用场了。
Nginx官方默认的ETag计算方式是为"文件最后修改时间16进制-文件长度16进制"。例:ETag: “59e72c84-2404”
Express框架使用了serve-static中间件来配置缓存方案,其中,使用了一个叫etag的npm包来实现etag计算。从其源码能够看出,有两种计算方式:
function stattag (stat) {
var mtime = stat.mtime.getTime().toString(16)
var size = stat.size.toString(16)
return '"' + size + '-' + mtime + '"'
}
复制代码
function entitytag (entity) {
if (entity.length === 0) {
// fast-path empty
return '"0-2jmj7l5rSw0yVb/vlWAYkK/YBwk"'
}
// compute hash of entity
var hash = crypto
.createHash('sha1')
.update(entity, 'utf8')
.digest('base64')
.substring(0, 27)
// compute length of entity
var len = typeof entity === 'string'
? Buffer.byteLength(entity, 'utf8')
: entity.length
return '"' + len.toString(16) + '-' + hash + '"'
}
复制代码
协商缓存,有ETag和Last-Modified两个字段。那当这两个字段同时存在的时候,会优先以哪一个为准呢?
在Express中,使用了fresh这个包来判断是不是最新的资源。主要源码以下:
function fresh (reqHeaders, resHeaders) {
// fields
var modifiedSince = reqHeaders['if-modified-since']
var noneMatch = reqHeaders['if-none-match']
// unconditional request
if (!modifiedSince && !noneMatch) {
return false
}
// Always return stale when Cache-Control: no-cache
// to support end-to-end reload requests
// https://tools.ietf.org/html/rfc2616#section-14.9.4
var cacheControl = reqHeaders['cache-control']
if (cacheControl && CACHE_CONTROL_NO_CACHE_REGEXP.test(cacheControl)) {
return false
}
// if-none-match
if (noneMatch && noneMatch !== '*') {
var etag = resHeaders['etag']
if (!etag) {
return false
}
var etagStale = true
var matches = parseTokenList(noneMatch)
for (var i = 0; i < matches.length; i++) {
var match = matches[i]
if (match === etag || match === 'W/' + etag || 'W/' + match === etag) {
etagStale = false
break
}
}
if (etagStale) {
return false
}
}
// if-modified-since
if (modifiedSince) {
var lastModified = resHeaders['last-modified']
var modifiedStale = !lastModified || !(parseHttpDate(lastModified) <= parseHttpDate(modifiedSince))
if (modifiedStale) {
return false
}
}
return true
}
复制代码
咱们能够看到,若是不是强制刷新,并且请求头带上了if-modified-since和if-none-match两个字段,则先判断etag,再判断last-modified。固然,若是你不喜欢这种策略,也能够本身实现一个。
上文主要说的是前端如何进行打包,那后端怎么作呢? 咱们知道,浏览器是根据响应头的相关字段来决定缓存的方案的。因此,后端的关键就在于,根据不一样的请求返回对应的缓存字段。 以nodejs为例,若是须要浏览器强缓存,咱们能够这样设置:
res.setHeader('Cache-Control', 'public, max-age=xxx');
复制代码
若是须要协商缓存,则能够这样设置:
res.setHeader('Cache-Control', 'public, max-age=0');
res.setHeader('Last-Modified', xxx);
res.setHeader('ETag', xxx);
复制代码
固然,如今已经有不少现成的库可让咱们很方便地去配置这些东西。 写了一个简单的demo,方便有须要的朋友去了解其中的原理,有兴趣的能够阅读源码
在作前端缓存时,咱们尽量设置长时间的强缓存,经过文件名加hash的方式来作版本更新。在代码分包的时候,应该将一些不常变的公共库独立打包出来,使其可以更持久的缓存。
以上,若有错漏,欢迎指正!
@Author: TDGarden