捋一捋浏览器缓存

时间 2019-12-01

原文原文链接

前言

在前端项目体验中，判断一个网站性能最直观的就是网页打开的速度，因此项目开发中在速度方面的性能优化最主要的就是使用缓存，对于一个数据请求来讲，能够分为发起网络请求、后端处理、浏览器响应三个步骤。浏览器缓存能够帮助咱们在第一和第三步骤中优化性能。好比说直接使用缓存而不发起请求，或者发起了请求但后端存储的数据和前端一致，那么就没有必要再将数据回传回来，这样就减小了响应数据。css

1、什么是浏览器缓存

Web缓存存在于服务器和客户端之间。Web缓存密切注视着服务器-客户端之间的通讯，监控请求，而且把请求输出的内容（例如html页面、图片和文件等静态资源）存储到电脑本地磁盘中；而后，若是下一个请求是相同的URL，则直接使用保存的副本，而不是再次请求源服务器。html

2、缓存的优缺点

【1】优势前端

减小网络延迟，加快页面打开速度--缓存比源服务器离客户端更近，所以，从缓存请求内容比从源服务器所用时间更少，缓存的使用可以明显加快页面打开速度，达到更好的体验。
下降服务器的压力--给网络资源设定有效期以后，用户能够重复使用本地的缓存，减小对源服务器的请求，间接下降服务器的压力。同时，搜索引擎的爬虫机器人也能根据过时机制下降爬取的频率，也能有效下降服务器的压力。
减小网络带宽损耗--不管对于网站运营者或者用户，带宽都表明着金钱,当Web缓存副本被使用时，只会产生极小的网络流量，能够有效的下降运营成本。

【2】缺点segmentfault

若是处理不当，可能会致使服务端代码更新了，可是用户却仍是老页面。因此前端们要针对项目中各个资源的实际状况，作出合理的缓存策略。

3、HTTP报文解析

浏览器的缓存机制也就是咱们说的HTTP缓存机制，其机制是根据HTTP报文的缓存标识进行的，因此在分析浏览器缓存机制以前，咱们先使用图文简单介绍一下HTTP报文，HTTP报文分为两种：后端

【1】HTTP请求(Request)报文：报文格式为：请求行—请求头—空行—请求报文主体(只有POST才有报文主体)，以下图

浏览器

【2】HTTP响应(Response)报文：报文格式为：状态行—响应头—空行—响应报文主体，以下图

缓存

4、缓存过程分析

浏览器与服务器通讯的方式为应答模式，便是：浏览器发起HTTP请求 – 服务器响应该请求。那么浏览器第一次向服务器发起该请求后拿到请求结果，会根据响应报文中HTTP头的缓存标识，决定是否缓存结果，是则将请求结果和缓存标识存入浏览器缓存中，简单的过程以下图：
性能优化

由上图咱们能够知道：服务器

浏览器每次发起请求，都会先在浏览器缓存中查找该请求的结果以及缓存标识
浏览器每次拿到返回的请求结果都会将该结果和缓存标识存入浏览器缓存中

以上两点结论就是浏览器缓存机制的关键，他确保了每一个请求的缓存存入与读取，只要咱们再理解浏览器缓存的使用规则，那么全部的问题就迎刃而解了，本文也将围绕着这点进行详细分析。为了方便你们理解，这里咱们根据是否须要向服务器从新发起HTTP请求将缓存过程分为两个部分，分别是强制缓存和协商缓存 。网络

5、强制缓存

强制缓存就是向浏览器缓存查找该请求结果，并根据该结果的缓存规则来决定是否使用该缓存结果的过程，强制缓存的状况主要有三种(暂不分析协商缓存过程)，以下：

【1】不存在该缓存结果和缓存标识，强制缓存失效，则直接向服务器发起请求（跟第一次发起请求一致），以下图：

【2】存在该缓存结果和缓存标识，且该结果还没有失效，强制缓存生效，直接返回该结果，以下图

【3】存在该缓存结果和缓存标识，但该结果已失效，强制缓存失效，则使用协商缓存(暂不分析)，以下图

6、强制缓存的缓存规则是什么？

当浏览器向服务器发起请求时，服务器会将缓存规则放入HTTP响应报文的HTTP头中和请求结果一块儿返回给浏览器，控制强制缓存的字段分别是Expires和Cache-Control，其中Cache-Control优先级比Expires高。

【1】Expires

Expires是HTTP/1.0控制网页缓存的字段，其值为服务器返回该请求结果缓存的到期时间，即再次发起该请求时，若是客户端的时间小于Expires的值时，直接使用缓存结果。

Q: Expires是HTTP/1.0的字段，可是如今浏览器默认使用的是HTTP/1.1，那么在HTTP/1.1中网页缓存仍是否由Expires控制？

到了HTTP/1.1，Expire已经被Cache-Control替代，缘由在于Expires控制缓存的原理是使用客户端的时间与服务端返回的时间作对比，那么若是客户端与服务端的时间由于某些缘由（例如时区不一样；客户端和服务端有一方的时间不许确）发生偏差，那么强制缓存则会直接失效，这样的话强制缓存的存在则毫无心义，那么Cache-Control又是如何控制的呢？

【2】Cache-Control

在HTTP/1.1中，Cache-Control是最重要的规则，主要用于控制网页缓存，主要取值为：

public：全部内容都将被缓存（客户端和代理服务器均可缓存）
private：全部内容只有客户端能够缓存，Cache-Control的默认取值
no-cache：客户端缓存内容，可是是否使用缓存则须要通过协商缓存来验证决定
no-store：全部内容都不会被缓存，即不使用强制缓存，也不使用协商缓存
max-age=xxx (xxx is numeric)：缓存内容将在xxx秒后失效

接下来，咱们直接看一个例子，以下：

由上面的例子咱们能够知道：

HTTP响应报文中expires的时间值，是一个绝对值
HTTP响应报文中Cache-Control为max-age=600，是相对值

因为Cache-Control的优先级比expires，那么直接根据Cache-Control的值进行缓存，意思就是说在600秒内再次发起该请求，则会直接使用缓存结果，强制缓存生效。注：在没法肯定客户端的时间是否与服务端的时间同步的状况下，Cache-Control相比于expires是更好的选择，因此同时存在时，只有Cache-Control生效。

7、浏览器的缓存存放在哪里，如何在浏览器中判断强制缓存是否生效？

在浏览器中的控制台Network中状态码Status为灰色的请求则表明使用了强制缓存，请求对应的Size值则表明该缓存存放的位置，size栏一般会有三种状态，分别为①from memory cache ②from disk cache ③资源自己的大小（eg: 16.4KB）

Q: 何时会使用from disk cache，何时会使用from memory cache呢？

from memory cache：不访问服务器，直接读缓存，从内存中读取缓存。此时的数据时缓存到内存中的，当kill进程后，也就是浏览器关闭之后，数据将不存在。

from disk cache：不访问服务器，直接读缓存，从磁盘中读取缓存，当kill进程时，数据仍是存在。

举个栗子：
①访问博客segmentfault.com/a/119000001… 返回200（从服务器获取）

②关闭该博客的标签页，从新打开segmentfault.com/a/119000001… ，返回200(from disk cache）

③按F5刷新，返回200(from memory cache)

Q: 看到这里可能有人小伙伴问了，最后一个步骤刷新的时候，不是同时存在着from disk cache和from memory cache吗？

对于这个问题，咱们须要了解内存缓存(from memory cache)和硬盘缓存(from disk cache)，以下

①内存缓存(from memory cache)：内存缓存具备两个特色，分别是快速读取和时效性：

快速读取：内存缓存会将编译解析后的文件，直接存入该进程的内存中，占据该进程必定的内存资源，以方便下次运行使用时的快速读取。

时效性：一旦该进程关闭，则该进程的内存则会清空。

②硬盘缓存(from disk cache)：硬盘缓存则是直接将缓存写入硬盘文件中，读取缓存须要对该缓存存放的硬盘文件进行I/O操做，而后从新解析该缓存内容，读取复杂，速度比内存缓存慢。

在浏览器中，浏览器会在js和图片等文件解析执行后直接存入内存缓存中，那么当刷新页面时只需直接从内存缓存中读取(from memory cache)；而css文件则会存入硬盘文件中，因此每次渲染页面都须要从硬盘读取缓存(from disk cache)。

8、浏览器读取缓存的顺序（memory –> disk）

先去内存看，若是有，直接加载
若是内存没有，择取硬盘获取，若是有直接加载
若是硬盘也没有，那么就进行网络请求
加载到的资源缓存到硬盘和内存

9、协商缓存

协商缓存就是强制缓存失效后，浏览器携带缓存标识向服务器发起请求，由服务器根据缓存标识判断该资源是否进行了修改，再决定使用缓存资源仍是从新返回资源，主要有如下两种状况：

【1】协商缓存生效，返回304，以下

【2】协商缓存失效，返回200和请求结果结果，以下

一样，协商缓存的标识也是在响应报文的HTTP头中和请求结果一块儿返回给浏览器的，控制协商缓存的字段分别有：Last-Modified / If-Modified-Since / Etag / If-None-Match，注：Etag / If-None-Match优先级高于Last-Modified / If-Modified-Since，同时存在则只有Etag / If-None-Match生效。

【1】Last-Modified：是服务器响应请求时，返回该资源文件在服务器最后被修改的时间

【2】If-Modified-Since：是客户端再次发起该请求时，携带上次请求返回的Last-Modified值，经过此字段值告诉服务器该资源上次请求返回的最后被修改时间。服务器收到该请求，发现请求头含有If-Modified-Since字段，则会根据If-Modified-Since的字段值与该资源在服务器的最后被修改时间作对比，若服务器的资源最后被修改时间大于If-Modified-Since的字段值，则从新返回资源，状态码为200；不然则返回304，表明资源无更新，可继续使用缓存文件

【3】Etag：是服务器响应请求时，返回当前资源文件的一个惟一标识(由服务器生成)

【4】If-None-Match：是客户端再次发起该请求时，携带上次请求返回的惟一标识Etag值，经过此字段值告诉服务器该资源上次请求返回的惟一标识值。服务器收到该请求后，发现该请求头中含有If-None-Match，则会根据If-None-Match的字段值与该资源在服务器的Etag值作对比，一致则返回304，表明资源无更新，继续使用缓存文件；不一致则从新返回资源文件，状态码为200

总结

强制缓存优先于协商缓存进行，若强制缓存(Expires和Cache-Control)生效则直接使用缓存，若不生效则进行协商缓存(Last-Modified / If-Modified-Since和Etag / If-None-Match)，协商缓存由服务器决定是否使用缓存，若协商缓存失效，那么表明该请求的缓存失效，从新获取请求结果，再存入浏览器缓存中；生效则返回304，继续使用缓存，主要流程程以下：