聊一聊http状态码，缓存机制，cookie

时间 2019-11-16

原文原文链接

Http状态码

状态码	含义
1XX	请求正在被处理
2XX	请求被成功处理
3XX	请求须要附加操做，常见如重定向
4XX	客户端出错致使请求没法被处理
5XX	服务端处理出错

2XX

状态码	缘由短语	含义
200	OK	请求被正常处理
204	NO CONTENT	请求成功，可是响应的报文中不含实体主体
206	Partial Content	只返回了请求资源的部分

204: 例如option请求，一般被用来作正式请求的预请求，这个请求只须要确认后续的请求能不能经过，即只须要一个结果，而不须要返回其余内容。算法

206: 在 http的请求中，头部添加Range用来表示范围请求，例如chrome

'Range': byte=5001-10000 // 表示本次要请求资源的5001-10000字节的部分

这种状况下，若是服务器接受范围请求而且成功处理，就会返回 206，而且在响应的头部返回：segmentfault

'Content-Range':bytes 5001-10000/10000// 表示整个资源有10000字节，本次返回的范围为 5001-10000字节

3XX

状态码	缘由短语	含义
301	Moved Permanently	资源被永久重定向了
302	Found	资源临时重定向到location
303	See Other	资源使用`GET`访问临时重定向的location
304	Not Modified	资源未改变，可直接使用缓存
307	Temporary Redirect	严格限制重定向不容许从`POST`转为`GET`

301与 302的惟一区别就在于一个是临时，一个是永久。

4XX

状态码	缘由短语	含义
400	Bad Request	请求中有语法错误
401	Unauthorized	未通过认证
403	Forbidden	禁止访问也就是无权限访问
404	Not Found	服务端没有找到所请求的资源

5XX

状态码	缘由短语	含义
500	Internal Server Error	服务器故障
503	Service Unavailable	服务器暂时没法使用

缓存机制

浏览器每次发起请求，都会先在浏览器缓存中查找该请求的结果以及缓存标识
浏览器每次拿到返回的请求结果都会将该结果和缓存标识存入浏览器缓存中浏览器

强缓存

强缓存不会向服务器发送请求，直接从缓存中读取资源，在 chrome 控制台的 Network 选项中能够看到该请求返回200的状态码，而且Size显示from disk cache或from memory cache。强缓存能够经过设置两种 HTTPHeader 实现：Expires和Cache-Control。缓存

1. Expires

缓存过时时间，用来指定资源到期的时间，是服务器端的具体的时间点。也就是说，Expires=max-age + 请求时间，须要和Last-modified结合使用。Expires 是 Web 服务器响应消息头字段，在响应 http 请求时告诉浏览器在过时时间前浏览器能够直接从浏览器缓存取数据，而无需再次请求。
Expires 是 HTTP/1 的产物，受限于本地时间，若是修改了本地时间，可能会形成缓存失效。Expires: Wed, 22 Oct 2018 08:41:00GMT 表示资源会在Wed, 22 Oct 2018 08:41:00 GMT后过时，须要再次请求。服务器

2. Cache-Control

在 HTTP/1.1 中，Cache-Control是最重要的规则，主要用于控制网页缓存。好比当Cache-Control:max-age=300时，则表明在这个请求正确返回时间（浏览器也会记录下来）的 5 分钟内再次加载资源，就会命中强缓存。
Cache-Control能够在请求头或者响应头中设置，而且能够组合使用多种指令：负载均衡

指令	做用
public	响应可被客户端和代理服务器缓存
private	响应只可被客户端缓存
max-age=30	缓存 30 秒后过时，须要从新请求
s-maxage=30	覆盖`max-age`，做用同样，只是在代理服务器中生效
no-store	不缓存任何响应
no-cache	资源被缓存，可是当即失效，下次会发起请求验证资源是否过时，配合协商缓存使用
max-stale=30	30 秒内，即便缓存过时也使用该缓存
min-fresh=30	但愿在 30 秒内获取最新的响应

详细说明：性能

public：全部内容都将被缓存（客户端和代理服务器均可缓存）。具体来讲响应可被任何中间节点缓存，如 Browser<--proxy1<--proxy2<--Server，中间的proxy能够缓存资源，好比下次再请求同一资源proxy1直接把本身缓存的东西给Browser而再也不向proxy2要。
private：全部内容只有客户端能够缓存，Cache-Control的默认取值。具体来讲，表示中间节点不容许缓存，对于Browser<--proxy1<--proxy2<--Server，proxy会老老实实把Server返回的数据发送给proxy1,本身不缓存任何数据。当下次Browser再次请求时proxy会作好请求转发而不是自做主张给本身缓存的数据。
no-cache：客户端缓存内容，是否使用缓存则须要通过协商缓存来验证决定。表示不使用Cache-Control的缓存控制方式作前置验证，而是使用Etag或者Last-Modified字段来控制缓存。代理

须要注意的是， no-cache这个名字有一点误导。设置了 no-cache以后，并非说浏览器就再也不缓存数据，只是浏览器在使用缓存数据时，须要先确认一下数据是否还跟服务器保持一致。
no-store：全部内容都不会被缓存，即不使用强制缓存，也不使用协商缓存
max-age：max-age=xxx(xxx is numeric)表示缓存内容将在 xxx 秒后失效
s-maxage（单位为 s)：同max-age做用同样，只在代理服务器中生效（好比 CDN 缓存）。好比当s-maxage=60时，在这 60 秒中，即便更新了 CDN 的内容，浏览器也不会进行请求。max-age用于普通缓存，而s-maxage用于代理缓存。s-maxage的优先级高于max-age。若是存在 s-maxage，则会覆盖掉max-age和Expiresheader。
max-stale：能容忍的最大过时时间。max-stale指令标示了客户端愿意接收一个已通过期了的响应。若是指定了max-stale的值，则最大容忍时间为对应的秒数。若是没有指定，那么说明浏览器愿意接收任何 age 的响应（age 表示响应由源站生成或确认的时间与当前时间的差值）。
min-fresh：可以容忍的最小新鲜度。min-fresh标示了客户端不肯意接受新鲜度很少于当前的 age 加上 min-fresh 设定的时间之和的响应。

3. Expires 和 Cache-Control 二者对比

其实这二者差异不大，区别就在于 Expires 是 http1.0 的产物，Cache-Control 是 http1.1 的产物，二者同时存在的话，Cache-Control 优先级高于 Expires；在某些不支持 HTTP1.1 的环境下，Expires 就会发挥用处。因此 Expires 实际上是过期的产物，现阶段它的存在只是一种兼容性的写法。code

强缓存判断是否缓存的依据来自因而否超出某个时间或者某个时间段，而不关心服务器端文件是否已经更新，这可能会致使加载文件不是服务器端最新的内容，那咱们如何获知服务器端内容是否已经发生了更新呢？此时咱们须要用到协商缓存策略。

协商缓存

协商缓存就是强制缓存失效后，浏览器携带缓存标识向服务器发起请求，由服务器根据缓存标识决定是否使用缓存的过程，主要有如下两种状况：

协商缓存生效，返回304和Not Modified
协商缓存失效，返回200和请求结果

协商缓存能够经过设置两种 HTTP 头Modified和ETag。

1. Last-Modified 和 If-Modified-Since

浏览器在第一次访问资源时，服务器返回资源的同时，在 response header 中添加Last-Modified的 header，值是这个资源在服务器上的最后修改时间，浏览器接收后缓存文件和 header；

Last-Modified: Fri, 22 Jul 2016 01:47:00 GMT

浏览器下一次请求这个资源，浏览器检测到有Last-Modified这个 header，因而添加If-Modified-Since这个 header，值就是Last-Modified中的值；服务器再次收到这个资源请求，会根据If-Modified-Since中的值与服务器中这个资源的最后修改时间对比，若是没有变化，返回 304 和空的响应体，直接从缓存读取，若是If-Modified-Since的时间小于服务器中这个资源的最后修改时间，说明文件有更新，因而返回新的资源文件和200.

可是 Last-Modified 存在一些弊端：

若是本地打开缓存文件，即便没有对文件进行修改，但仍是会形成 Last-Modified 被修改，服务端不能命中缓存致使发送相同的资源.由于 Last-Modified 只能以秒计时，若是在不可感知的时间内修改完成文件，那么服务端会认为资源仍是命中了，不会返回正确的资源.既然根据文件修改时间来决定是否缓存尚有不足，可否能够直接根据文件内容是否修改来决定缓存策略？因此在 HTTP/1.1 出现了ETag和If-None-Match;

2. ETag 和 If-None-Match

Etag是服务器响应请求时，返回当前资源文件的一个惟一标识(由服务器生成)，只要资源有变化，Etag 就会从新生成。浏览器在下一次加载资源向服务器发送请求时，会将上一次返回的 Etag 值放到 request header 里的If-None-Match里，服务器只须要比较客户端传来的 If-None-Match 跟本身服务器上该资源的 ETag 是否一致，就能很好地判断资源相对客户端而言是否被修改过了。若是服务器发现 ETag 匹配不上，那么直接以常规GET 200回包形式将新的资源（固然也包括了新的 ETag）发给客户端；若是 ETag 是一致的，则直接返回304知会客户端直接使用本地缓存便可。

3. 二者之间对比

首先在精确度上，Etag 要优于 Last-Modified。
Last-Modified 的时间单位是秒，若是某个文件在 1 秒内改变了屡次，那么他们的 Last-Modified 其实并无体现出来修改，可是 Etag 每次都会改变确保了精度；若是是负载均衡的服务器，各个服务器生成的 Last-Modified 也有可能不一致。
第二在性能上，Etag 要逊于 Last-Modified，毕竟 Last-Modified 只须要记录时间，而 Etag 须要服务器经过算法来计算出一个 hash 值。
第三在优先级上，服务器校验优先考虑 Etag。

强制缓存优先于协商缓存进行，若强制缓存(Expires 和 Cache-Control)生效则直接使用缓存，若不生效则进行协商缓存(Last-Modified / If-Modified-Since 和 Etag / If-None-Match)，协商缓存由服务器决定是否使用缓存，若协商缓存失效，那么表明该请求的缓存失效，返回 200，从新返回资源和缓存标识，再存入浏览器缓存中；生效则返回 304，继续使用缓存。

实际场景应用缓存策略

1. 频繁变更的资源

Cache-Control: no-cache

对于频繁变更的资源，首先须要使用Cache-Control: no-cache使浏览器每次都请求服务器，而后配合ETag或者Last-Modified来验证资源是否有效。这样的作法虽然不能节省请求数量，可是能显著减小响应数据大小。

2. 不常变化的资源

Cache-Control: max-age=31536000

一般在处理这类资源时，给它们的Cache-Control配置一个很大的max-age=31536000(一年)，这样浏览器以后请求相同的 URL 会命中强制缓存。而为了解决更新的问题，就须要在文件名(或者路径)中添加 hash，版本号等动态字符，以后更改动态字符，从而达到更改引用 URL 的目的，让以前的强制缓存失效(其实并未当即失效，只是再也不使用了而已)。

内容参考:浏览器的缓存机制

Cookie的实现机制

Cookie是由客户端保存的小型文本文件，其内容为一系列的键值对。 Cookie是由HTTP服务器设置的，保存在浏览器中，在用户访问其余页面时，会在HTTP请求中附上该服务器以前设置的Cookie。

浏览器向某个URL发起HTTP请求（能够是任何请求，好比GET一个页面、POST一个登陆表单等）
对应的服务器收到该HTTP请求，并计算应当返回给浏览器的HTTP响应。
在响应头加入Set-Cookie字段，它的值是要设置的Cookie。
浏览器收到来自服务器的HTTP响应。
浏览器在响应头中发现Set-Cookie字段，就会将该字段的值保存在内存或者硬盘中。

Set-Cookie字段的值能够是不少项Cookie，每一项均可以指定过时时间Expires。默认的过时时间是用户关闭浏览器时。

浏览器下次给该服务器发送HTTP请求时，会将服务器设置的Cookie附加在HTTP请求的头字段Cookie中。

浏览器能够存储多个域名下的Cookie，但只发送当前请求的域名曾经指定的Cookie，这个域名也能够在Set-Cookie字段中指定）。

服务器收到这个HTTP请求，发现请求头中有Cookie字段，便知道以前就和这个用户打过交道了。
过时的Cookie会被浏览器删除。

总之，服务器经过Set-Cookie响应头字段来指示浏览器保存Cookie，浏览器经过Cookie请求头字段来告诉服务器以前的状态。 Cookie中包含若干个键值对，每一个键值对能够设置过时时间。