完全理解浏览器的缓存机制

这是我参与8月更文挑战的第3天，活动详情查看：8月更文挑战css

概述

浏览器的缓存机制也就是咱们说的HTTP缓存机制，其机制是根据HTTP报文的缓存标识进行的，因此在分析浏览器缓存机制以前，咱们先使用图文简单介绍一下HTTP报文，HTTP报文分为两种：web

HTTP请求(Request)报文，报文格式为：请求行 – HTTP头(通用信息头，请求头，实体头) – 请求报文主体(只有POST才有报文主体)，以下图浏览器

HTTP响应(Response)报文，报文格式为：状态行 – HTTP头(通用信息头，响应头，实体头) – 响应报文主体，以下图缓存

注：通用信息头指的是请求和响应报文都支持的头域，分别为Cache-Control、Connection、Date、Pragma、Transfer-Encoding、Upgrade、Via；实体头则是实体信息的实体头域，分别为Allow、Content-Base、Content-Encoding、Content-Language、Content-Length、Content-Location、Content-MD五、Content-Range、Content-Type、Etag、Expires、Last-Modified、extension-header。这里只是为了方便理解，将通用信息头，响应头/请求头，实体头都归为了HTTP头。性能优化

为何须要浏览器缓存？

咱们知道经过HTTP协议，在客户端和浏览器创建链接时须要消耗时间，而大的响应须要在客户端和服务器之间进行屡次往返通讯才能得到完整的响应，这拖延了浏览器可使用和处理内容的时间。这就增长了访问服务器的数据和资源的成本，所以利用浏览器的缓存机制重用之前获取的数据就变成了性能优化时须要考虑的事情。服务器

缓存过程分析

浏览器与服务器通讯的方式为应答模式，便是：浏览器发起HTTP请求 – 服务器响应该请求。那么浏览器第一次向服务器发起该请求后拿到请求结果，会根据响应报文中HTTP头的缓存标识，决定是否缓存结果，是则将请求结果和缓存标识存入浏览器缓存中，简单的过程以下图：markdown

由上图咱们能够知道：post

浏览器每次发起请求，都会先在浏览器缓存中查找该请求的结果以及缓存标识
浏览器每次拿到返回的请求结果都会将该结果和缓存标识存入浏览器缓存中

以上两点结论就是浏览器缓存机制的关键，他确保了每一个请求的缓存存入与读取，只要咱们再理解浏览器缓存的使用规则，那么全部的问题就迎刃而解了。为了方便理解，这里根据是否须要向服务器从新发起HTTP请求将缓存过程分为两个部分，分别是强制缓存和协商缓存。性能

强制缓存

强制缓存就是向浏览器缓存查找该请求结果，并根据该结果的缓存规则来决定是否使用该缓存结果的过程。优化

强制缓存的状况主要有三种(暂不分析协商缓存过程)，以下：

不存在该缓存结果和缓存标识，强制缓存失效，则直接向服务器发起请求（跟第一次发起请求一致），以下图：

存在该缓存结果和缓存标识，但该结果已失效，强制缓存失效，则使用协商缓存(暂不分析)，以下图

存在该缓存结果和缓存标识，且该结果还没有失效，强制缓存生效，直接返回该结果，以下图

那么强制缓存的缓存规则是什么？

当浏览器向服务器发起请求时，服务器会将缓存规则放入HTTP响应报文的HTTP头中和请求结果一块儿返回给浏览器，控制强制缓存的字段分别是Expires和Cache-Control，其中Cache-Control优先级比Expires高。

Expires

Expires是HTTP/1.0控制网页缓存的字段，其值为服务器返回该请求结果缓存的到期时间，即再次发起该请求时，若是客户端的时间小于Expires的值时，直接使用缓存结果。

Expires是HTTP/1.0的字段，可是如今浏览器默认使用的是HTTP/1.1，那么在HTTP/1.1中网页缓存仍是否由Expires控制？

到了HTTP/1.1，Expire已经被Cache-Control替代，缘由在于Expires控制缓存的原理是使用客户端的时间与服务端返回的时间作对比，那么若是客户端与服务端的时间由于某些缘由（例如时区不一样；客户端和服务端有一方的时间不许确）发生偏差，那么强制缓存则会直接失效，这样的话强制缓存的存在则毫无心义，那么Cache-Control又是如何控制的呢？

Cache-Control

在HTTP/1.1中，Cache-Control是最重要的规则，主要用于控制网页缓存，主要取值为：

public：全部内容都将被缓存（客户端和代理服务器均可缓存）
private：全部内容只有客户端能够缓存，Cache-Control的默认取值
no-cache：客户端缓存内容，可是是否使用缓存则须要通过协商缓存来验证决定
no-store：全部内容都不会被缓存，即不使用强制缓存，也不使用协商缓存
max-age=xxx (xxx is numeric)：缓存内容将在xxx秒后失效

接下来，咱们直接看一个例子，以下：

由上面的例子咱们能够知道：

HTTP响应报文中expires的时间值，是一个绝对值
HTTP响应报文中Cache-Control为max-age=600，是相对值

因为Cache-Control的优先级比expires，那么直接根据Cache-Control的值进行缓存，意思就是说在600秒内再次发起该请求，则会直接使用缓存结果，强制缓存生效。

注：在没法肯定客户端的时间是否与服务端的时间同步的状况下，Cache-Control相比于expires是更好的选择，因此同时存在时，只有Cache-Control生效。

了解强制缓存的过程后，咱们拓展性的思考一下：

浏览器的缓存存放在哪里，如何在浏览器中判断强制缓存是否生效？

这里咱们以博客的请求为例，状态码为灰色的请求则表明使用了强制缓存，请求对应的Size值则表明该缓存存放的位置，分别为from memory cache 和 from disk cache。

那么from memory cache 和 from disk cache又分别表明的是什么呢？何时会使用from disk cache，何时会使用from memory cache呢？

from memory cache表明使用内存中的缓存，from disk cache则表明使用的是硬盘中的缓存，浏览器读取缓存的顺序为memory –> disk。

from disk cache和from memory cache 可能同时存在着？

对于这个问题，咱们须要了解内存缓存(from memory cache)和硬盘缓存(from disk cache)，以下:

内存缓存(from memory cache)：内存缓存具备两个特色，分别是快速读取和时效性：
- 快速读取：内存缓存会将编译解析后的文件，直接存入该进程的内存中，占据该进程必定的内存资源，以方便下次运行使用时的快速读取。
- 时效性：一旦该进程关闭，则该进程的内存则会清空。
硬盘缓存(from disk cache)：硬盘缓存则是直接将缓存写入硬盘文件中，读取缓存须要对该缓存存放的硬盘文件进行I/O操做，而后从新解析该缓存内容，读取复杂，速度比内存缓存慢。

在浏览器中，浏览器会在js和图片等文件解析执行后直接存入内存缓存中，那么当刷新页面时只需直接从内存缓存中读取(from memory cache)；而css文件则会存入硬盘文件中，因此每次渲染页面都须要从硬盘读取缓存(from disk cache)。

协商缓存

协商缓存就是强制缓存失效后，浏览器携带缓存标识向服务器发起请求，由服务器根据缓存标识决定是否使用缓存的过程，主要有如下两种状况：

协商缓存生效，返回304，以下

304

协商缓存失效，返回200和请求结果结果，以下

200

一样，协商缓存的标识也是在响应报文的HTTP头中和请求结果一块儿返回给浏览器的，控制协商缓存的字段分别有：Last-Modified / If-Modified-Since和Etag / If-None-Match，其中Etag / If-None-Match的优先级比Last-Modified / If-Modified-Since高。

Last-Modified / If-Modified-Since

Last-Modified是服务器响应请求时，返回该资源文件在服务器最后被修改的时间，以下。

last-modify

If-Modified-Since则是客户端再次发起该请求时，携带上次请求返回的Last-Modified值，经过此字段值告诉服务器该资源上次请求返回的最后被修改时间。服务器收到该请求，发现请求头含有If-Modified-Since字段，则会根据If-Modified-Since的字段值与该资源在服务器的最后被修改时间作对比，若服务器的资源最后被修改时间大于If-Modified-Since的字段值，则从新返回资源，状态码为200；不然则返回304，表明资源无更新，可继续使用缓存文件，以下。

If-Modified-Since

Etag / If-None-Match

Etag是服务器响应请求时，返回当前资源文件的一个惟一标识(由服务器生成)，以下。

Etag的工做原理

如上图，服务器在第一次返回响应的时候设置了缓存的时间120s，假设浏览器在这120s通过以后再次请求服务器相同的资源，首先，浏览器会检查本地缓存并找到以前的响应，不幸的是，这个响应如今已经’过时’，没法在使用。此时，浏览器也能够直接发出新请求，获取新的完整响应，可是这样作效率较低，由于若是资源未被更改过，咱们就没有理由再去下载与缓存中已有的彻底相同的字节。

因而就到了Etag发挥做用的时候了，一般服务器生成并返回在Etag中的验证码，经常是文件内容的哈希值或者某个其余指纹码。客户端没必要了解指纹码是如何生成的，只须要在下一个请求中将其发送给服务器(浏览器默认会添加)：若是指纹码仍然一致，说明资源未被修改，服务器会反悔304 Not Modified，这样咱们就能够跳过下载，利用已经缓存了的资源，而且该资源会继续缓存120s。

If-None-Match是客户端再次发起该请求时，携带上次请求返回的惟一标识Etag值，经过此字段值告诉服务器该资源上次请求返回的惟一标识值。服务器收到该请求后，发现该请求头中含有If-None-Match，则会根据If-None-Match的字段值与该资源在服务器的Etag值作对比，一致则返回304，表明资源无更新，继续使用缓存文件；不一致则从新返回资源文件，状态码为200，以下。

Etag-match

注：Etag / If-None-Match优先级高于Last-Modified / If-Modified-Since，同时存在则只有Etag / If-None-Match生效。

总结

浏览器缓存分为强制缓存和协商缓存，强制缓存优先于协商缓存进行。

若强制缓存(Expires和Cache-Control,Cache-Control优先级高于Expires)生效则直接使用缓存
若不生效则进行协商缓存(Last-Modified / If-Modified-Since和Etag / If-None-Match，其中Etag / If-None-Match的优先级比Last-Modified / If-Modified-Since高)，协商缓存由服务器决定是否使用缓存
若协商缓存失效，那么表明该请求的缓存失效，从新获取请求结果，再存入浏览器缓存中；生效则返回304，继续使用缓存

主要过程以下：

文中若有错误，欢迎在评论区指正，若是这篇文章帮到了你，欢迎点赞👍和关注😊，但愿点赞多多多多...