Web先后端缓存技术（缓存的主要做用是什么）

时间 2019-12-01

标签 web 后端缓存技术主要什么栏目 HTML 繁體版

原文原文链接

Web先后端缓存技术Web先后端缓存技术（缓存的主要做用是什么）

1、总结

一句话总结：

加快页面打开速度

减小网络带宽消耗

下降服务器压力

一、在Web应用中，应用缓存的地方有哪些？

主要有浏览器缓存，页面缓存，服务器缓存，数据库缓存等

二、服务器缓存主要分为哪两个？

CDN缓存

Combo缓存

三、浏览器端缓存规则在哪里定义？

主要在HTTP协议头和HTML的meta标签中定义。

他们分别重新鲜度和校验值两个维度来规定浏览器是否能够直接使用缓存中的副本，仍是须要去源服务器获取更新的版本。css

四、浏览器端缓存是否刷新的两个关键是什么？

新鲜度（过时机制）：也就是缓存副本有效期。

校验值（验证机制）：服务器返回资源的时候有时在控制头信息带上这个资源的实体标签Etag（Entity Tag），它能够用来做为浏览器再次请求过程的校验标识。

新鲜度（过时机制）：也就是缓存副本有效期。一个缓存副本必须知足如下条件，浏览器会认为它是有效的，足够新的：
    含有完整的过时时间控制头信息（HTTP协议报头），而且仍在有效期内；
    浏览器已经使用过这个缓存副本，而且在一个会话中已经检查过新鲜度
    知足以上两个状况的一种，浏览器会直接从缓存中获取副本并渲染。

知足以上两个状况的一种，浏览器会直接从缓存中获取副本并渲染。

校验值（验证机制）：服务器返回资源的时候有时在控制头信息带上这个资源的实体标签Etag（Entity Tag），它能够用来做为浏览器再次请求过程的校验标识。如过发现校验标识不匹配，说明资源已经被修改或过时，浏览器需求从新获取资源内容。

html

五、当一个用户发起一个静态资源请求的时候，浏览器会经过哪些步骤来获取资源？

本地缓存阶段：先在本地查找该资源，若是有发现该资源，并且该资源尚未过时，就使用这一个资源，彻底不会发送http请求到服务器；

协商缓存阶段：若是在本地缓存找到对应的资源，可是不知道该资源是否过时或者已通过期，则发一个http请求到服务器,而后服务器判断这个请求，若是请求的资源在服务器上没有改动过，则返回304，让浏览器使用本地找到的那个资源；

缓存失败阶段：当服务器发现请求的资源已经修改过，或者这是一个新的请求(在原本没有找到资源)，服务器则返回该资源的数据，而且返回200，固然这个是指找到资源的状况下，若是服务器上没有这个资源，则返回404。

六、浏览器中的操做对缓存的影响？

强制刷新 – 当按下ctrl+F5来刷新页面的时候, 浏览器将绕过各类缓存(本地缓存和协商缓存), 直接让服务器返回最新的资源;

普通刷新 – 当按下F5或者点击刷新按钮来刷新页面的时候,浏览器将绕过本地缓存来发送请求到服务器, 此时, 协商缓存是有效的

回车或转向 – 当在地址栏上输入回车或者按下跳转按钮的时候, 全部缓存都生效

七、页面缓存是什么？

页面缓存是将动态页面直接生成静态的页面放在服务器端

页面缓存是将动态页面直接生成静态的页面放在服务器端，用户调取相同页面时，静态页面将直接下载到客户端，再也不须要经过程序的运行和数据库的访问，大大节约了服务器的负载。
每次访问页面时，会检测相应的缓存页面是否存在，若不存在，则链接数据库获得数据渲染页面并生成缓存页面文件，这样下次访问的页面文件就发挥做用了。前端

八、数据库缓存是什么？

数据库会在内存划分一个专门的区域，用来存放用户最近执行的查询

数据库的缓存通常由数据库提供，能够对表创建高速缓存。数据库中，用户可能屡次执行相同的查询语句，为了提升查询效率，数据库会在内存划分一个专门的区域，用来存放用户最近执行的查询，这块区域就是缓存。
数据库缓存的使用必须在必定的应用环境下：查询的数据库表不会常常变更、有大量相同的查询(如订单信息查询)。web

九、缓存的同步是什么，以及经常使用的两种方案？

缓存的同步指的是写命中缓存的时候，若是保持缓存与磁盘上数据一致性的问题。

直写式WT(Write Through)：当CPU要将数据写入内存时，除了更新缓冲内存上的数据外，也将数据写在磁盘中以维持主存与缓冲内存的一致性，当要写入内存的数据多起来的话,速度天然就慢了下来。

回写式WB(Write Back)：当CPU要将数据写入内存时，只会先更新缓冲内存上的数据，随后再让缓冲内存在总线不塞车的时候才把数据写回磁盘，因此速度会快得多。

两种方式各有利弊，直写缓存方法利用了高速缓存中的数据始终与主存储器中数据匹配的特色。可是，须要的总线周期却很是耗时，从而下降性能。回写缓存能够维持性能，由于写入始终是在“爆发”中进行的，于是运行所需的总线周期将大大减小。
两个CPU，或者CPU与DMA同时共享一块物理内存时，writer在写完后，要write back，这样另外一个reader才能看到它写入的数据；在writer变为reader的时候，须要invalidate，不然看不到另外一个 writer写入的数据。因此在共享的时候，须要同时作writeback和invalidate。算法

十、与缓存相关的算法有哪些？

先进先出算法(FIFO)：若是一个数据最早进入缓存中，则应该最先淘汰掉。若是服务器接受到的数据请求与时间高度相关，能够考虑使用FIFO算法。

最不常用算法（LFU）：这个缓存算法使用一个计数器来记录条目被访问的频率。经过使用LFU缓存算法，最低访问数的条目首先被移除。这个方法并不常用，由于它没法对一个拥有最初高访问率以后长时间没有被访问的条目缓存负责。

最近最少使用算法（LRU）：这个缓存算法将最近使用的条目存放到靠近缓存顶部的位置。当一个新条目被访问时，LRU将它放置到缓存的顶部。当缓存达到极限时，较早以前访问的条目将从缓存底部开始被移除。这里会使用到昂贵的算法，并且它须要记录“年龄位”来精确显示条目是什么时候被访问的。此外，当一个LRU缓存算法删除某个条目后，“年龄位”将随其余条目发生改变。

自适应缓存替换算法(ARC)：在IBM Almaden研究中心开发，这个缓存算法同时跟踪记录LFU和LRU，以及驱逐缓存条目，来得到可用缓存的最佳使用。

最近最常使用算法（MRU）：这个缓存算法最早移除最近最常使用的条目。一个MRU算法擅长处理一个条目越久，越容易被访问的状况。

十一、图片缓存中的图片分发是什么意思？

网站会将图片存储从网站中分离出来，假设一个或多个图片服务器来存储图片，将图片放到一个虚拟目录中，而网页上仍然用同一个URL地址指向服务器上的某一个图片的地址。

网页传输过程当中，图片会占用大量的数据量，是影响网站性能的主要因素，所以大部分网站会将图片存储从网站中分离出来，假设一个或多个图片服务器来存储图片，将图片放到一个虚拟目录中，而网页上仍然用同一个URL地址指向服务器上的某一个图片的地址。这样能够大大提升网站的性能。数据库

2、Web先后端缓存技术

参考：Web先后端缓存技术
https://blog.csdn.net/yzj5208/article/details/82080868后端

Web缓存技术

1、缓存概述

缓存本来是一个硬件的概念：缓存就是数据交换的缓冲区（称做Cache），当某一硬件要读取数据时，会首先从缓存中查找须要的数据，若是找到了则直接执行，找不到的话则从内存中找。因为缓存的运行速度比内存快得多，故缓存的做用就是帮助硬件更快地运行。浏览器

在一个Web应用中，应用到缓存的地方有不少，主要有浏览器缓存，页面缓存，服务器缓存，数据库缓存等。缓存

缓存的做用主要有：服务器

加快页面打开速度
减小网络带宽消耗
下降服务器压力

2、浏览器缓存

浏览器端缓存规则主要在HTTP协议头和HTML的meta标签中定义。他们分别重新鲜度和校验值两个维度来规定浏览器是否能够直接使用缓存中的副本，仍是须要去源服务器获取更新的版本。

新鲜度（过时机制）：也就是缓存副本有效期。一个缓存副本必须知足如下条件，浏览器会认为它是有效的，足够新的：

含有完整的过时时间控制头信息（HTTP协议报头），而且仍在有效期内；
浏览器已经使用过这个缓存副本，而且在一个会话中已经检查过新鲜度
知足以上两个状况的一种，浏览器会直接从缓存中获取副本并渲染。

知足以上两个状况的一种，浏览器会直接从缓存中获取副本并渲染。

校验值（验证机制）：服务器返回资源的时候有时在控制头信息带上这个资源的实体标签Etag（Entity Tag），它能够用来做为浏览器再次请求过程的校验标识。如过发现校验标识不匹配，说明资源已经被修改或过时，浏览器需求从新获取资源内容。

使用HTML Meta 标签，Web开发者能够在HTML页面的<head>节点中加入<meta>标签，代码以下：

<META HTTP-EQUIV="Pragma" CONTENT="no-cache">

上述代码的做用是告诉浏览器当前页面不被缓存，每次访问都须要去服务器拉取。使用上很简单，但只有部分浏览器能够支持，并且全部缓存代理服务器都不支持，由于代理不解析HTML内容自己。而普遍应用的仍是 HTTP头信息来控制缓存。

在HTTP请求和响应的消息报头中，常见的与缓存有关的消息报头有：

HTTP缓存机制

缓存行为主要由缓存策略决定，而缓存策略由内容拥有者设置。这些策略主要经过特定的HTTP头部来清晰地表达。

当一个用户发起一个静态资源请求的时候，浏览器会经过如下几步来获取资源：

本地缓存阶段：先在本地查找该资源，若是有发现该资源，并且该资源尚未过时，就使用这一个资源，彻底不会发送http请求到服务器；
协商缓存阶段：若是在本地缓存找到对应的资源，可是不知道该资源是否过时或者已通过期，则发一个http请求到服务器,而后服务器判断这个请求，若是请求的资源在服务器上没有改动过，则返回304，让浏览器使用本地找到的那个资源；
缓存失败阶段：当服务器发现请求的资源已经修改过，或者这是一个新的请求(在原本没有找到资源)，服务器则返回该资源的数据，而且返回200，固然这个是指找到资源的状况下，若是服务器上没有这个资源，则返回404。

用户操做行为与缓存的关系

浏览器中的操做对缓存的影响:

强制刷新 – 当按下ctrl+F5来刷新页面的时候, 浏览器将绕过各类缓存(本地缓存和协商缓存), 直接让服务器返回最新的资源;
普通刷新 – 当按下F5或者点击刷新按钮来刷新页面的时候,浏览器将绕过本地缓存来发送请求到服务器, 此时, 协商缓存是有效的
回车或转向 – 当在地址栏上输入回车或者按下跳转按钮的时候, 全部缓存都生效

本地缓存阶段

Expires

指定缓存到期GMT的绝对时间，若是设了max-age，max-age就会覆盖expires。若是expires到期须要从新请求。

Cache-Control

Cache-Control是http 1.1中为了弥补 Expires 缺陷新加入的。对已缓存的内容进行控制：

Cache-control: public表示缓存的版本能够被代理服务器或者其余中间服务器识别。
Cache-control: private意味着这个文件对不一样的用户是不一样的。只有用户本身的浏览器可以进行缓存，公共的代理服务器不容许缓存。
Cache-control: no-cache意味着文件的内容不该当被缓存。这在搜索或者翻页结果中很是有用，由于一样的URL，对应的内容会发生变化。

其余相关控制字段

max-age: 指定缓存过时的相对时间秒数，max-ag=0或者是负值，浏览器会在对应的缓存中把Expires设置为1970-01-01 08:00:00。
s-maxage: 相似于max-age，只用在共享缓存上，好比proxy。
public: 一般状况下须要http身份验证的状况，响应是不可cahce的，加上public可使它被cache。
no-cache: 强制浏览器在使用cache拷贝以前先提交一个http请求到源服务器进行确认。这对身份验证来讲是很是有用的,能比较好的遵照 (能够结合public进行考虑)。它对维持一个资源老是最新的也颇有用，与此同时还不彻底丧失cache带来的好处)，由于它在本地是有拷贝的，可是在用以前都进行了确认，这样http请求并未减小，但可能会减小一个响应体。
no-store: 告诉浏览器在任何状况下都不要进行cache，不在本地保留拷贝。
must-revalidate: 强制浏览器严格遵照你设置的cache规则。
proxy-revalidate: 强制proxy严格遵照你设置的cache规则。
cache：使用本地缓存，不发生请求。

用法举例: Cache-Control: max-age=3600, must-revalidate

协商缓存阶段

Last-Modified & if-modified-since

Last-Modified与If-Modified-Since是一对报文头，属于http 1.0。
last-modified是WEB服务器认为对象的最后修改时间，好比文件的最后修改时间，动态页面的最后产生时间。

ETag & If-None-Match

ETag与If-None-Match是一对报文，属于http 1.1。

ETag能够用来解决这种问题。ETag是一个文件的惟一标志符。就像一个哈希或者指纹，每一个文件都有一个单独的标志，只要这个文件发生了改变，这个标志就会发生变化。

ETag机制相似于乐观锁机制，若是请求报文的ETag与服务器的不一致，则表示该资源已经被修改过，须要发最新的内容给浏览器。

同时使用这两个报文头，在彻底匹配If-Modified-Since和If-None-Match即检查完修改时间和Etag以后，如都与服务器的相符，服务器返回304，不然，发送最新内容给浏览器。

Etag/lastModified过程以下：

客户端请求一个页面（A）。
服务器返回页面A，并在给A加上一个Last-Modified/ETag。
客户端展示该页面，并将页面连同Last-Modified/ETag一块儿缓存。
客户再次请求页面A，并将上次请求时服务器返回的Last-Modified/ETag一块儿传递给服务器。
服务器检查该Last-Modified或ETag，并判断出该页面自上次客户端请求以后还未被修改，直接返回响应304和一个空的响应体。

304：经过If-Modified-Since If-Match判断资源是否修改，如未修改则返回304，发生了一次请求，但请求内容长度为0，节省了带宽。若是有多台负载均衡的服务器，不一样服务器计算出的Etag可能不一样，这样就会形成资源的重复加载。

Etag 主要为了解决 Last-Modified 没法解决的一些问题：

一、一些文件也许会周期性的更改，可是他的内容并不改变(仅仅改变的修改时间)，这个时候咱们并不但愿客户端认为这个文件被修改了，而从新GET；

二、某些文件修改很是频繁，好比在秒如下的时间内进行修改，(比方说1s内修改了N次)，If-Modified-Since能检查到的粒度是s级的，这种修改没法判断(或者说UNIX记录MTIME只能精确到秒)；

三、某些服务器不能精确的获得文件的最后修改时间。

其余标签

Content-Length：尽管并无在缓存中明确涉及，Content-Length头部在设置缓存策略时很重要。某些软件若是不提早获知内容的大小以留出足够空间，则会拒绝缓存该内容。

Vary：缓存系统一般使用请求的主机和路径做为存储该资源的键。当判断一个请求是不是请求一样内容时，Vary头部能够被用来提醒缓存系统须要注意另外一个附加头部。它一般被用来告诉缓存系统一样注意Accept-Encoding头部，以便缓存系统可以区分压缩和未压缩的内容。

总结

浏览器第一次请求时:

浏览器再次请求时：

Question: 设置了一个月才过时的缓存，若是服务器端更新了css代码，要怎么让用户更新缓存呢？

3、页面缓存

页面缓存是将动态页面直接生成静态的页面放在服务器端，用户调取相同页面时，静态页面将直接下载到客户端，再也不须要经过程序的运行和数据库的访问，大大节约了服务器的负载。每次访问页面时，会检测相应的缓存页面是否存在，若不存在，则链接数据库获得数据渲染页面并生成缓存页面文件，这样下次访问的页面文件就发挥做用了。

MemCache的缓存策略：(visio不能用了，本身画的，略丑慎看)

4、数据库缓存

数据库的缓存通常由数据库提供，能够对表创建高速缓存。数据库中，用户可能屡次执行相同的查询语句，为了提升查询效率，数据库会在内存划分一个专门的区域，用来存放用户最近执行的查询，这块区域就是缓存。

数据库缓存的使用必须在必定的应用环境下：查询的数据库表不会常常变更、有大量相同的查询(如订单信息查询)。

PS：这个缓存策略也能够用在前端，好比订单信息不变的状况下，能够在前端设置一个对象，保存请求的地址、参数、结果，第一次请求时会保存请求的地址、参数和结果，再次请求时，若是请求的地址、参数同样，则查询该对象直接返回请求的结果。

5、缓存的同步、复制与分发

缓存的同步指的是写命中缓存的时候，若是保持缓存与磁盘上数据一致性的问题。通常有两种方案：

直写式WT(Write Through)：当CPU要将数据写入内存时，除了更新缓冲内存上的数据外，也将数据写在磁盘中以维持主存与缓冲内存的一致性，当要写入内存的数据多起来的话,速度天然就慢了下来。
回写式WB(Write Back)：当CPU要将数据写入内存时，只会先更新缓冲内存上的数据，随后再让缓冲内存在总线不塞车的时候才把数据写回磁盘，因此速度会快得多。

6、与缓存相关的算法

先进先出算法(FIFO)：若是一个数据最早进入缓存中，则应该最先淘汰掉。若是服务器接受到的数据请求与时间高度相关，能够考虑使用FIFO算法。
最不常用算法（LFU）：这个缓存算法使用一个计数器来记录条目被访问的频率。经过使用LFU缓存算法，最低访问数的条目首先被移除。这个方法并不常用，由于它没法对一个拥有最初高访问率以后长时间没有被访问的条目缓存负责。
最近最少使用算法（LRU）：这个缓存算法将最近使用的条目存放到靠近缓存顶部的位置。当一个新条目被访问时，LRU将它放置到缓存的顶部。当缓存达到极限时，较早以前访问的条目将从缓存底部开始被移除。这里会使用到昂贵的算法，并且它须要记录“年龄位”来精确显示条目是什么时候被访问的。此外，当一个LRU缓存算法删除某个条目后，“年龄位”将随其余条目发生改变。
自适应缓存替换算法(ARC)：在IBM Almaden研究中心开发，这个缓存算法同时跟踪记录LFU和LRU，以及驱逐缓存条目，来得到可用缓存的最佳使用。
最近最常使用算法（MRU）：这个缓存算法最早移除最近最常使用的条目。一个MRU算法擅长处理一个条目越久，越容易被访问的状况。

应用：图片缓存的预载与分发

图片的预加载

为了防止图片在须要的时候才加载，而付出的时间开销，能够将图片进行预加载。代码以下：

<html>
<script>
    var img = new Image();
    image.src = "b.jpg";
</script>
<body>
    <img src="a.jpg" alt="pic" onmouseover="this.src='b.jpg'">
</body>
</html>

图片的分发

网页传输过程当中，图片会占用大量的数据量，是影响网站性能的主要因素，所以大部分网站会将图片存储从网站中分离出来，假设一个或多个图片服务器来存储图片，将图片放到一个虚拟目录中，而网页上仍然用同一个URL地址指向服务器上的某一个图片的地址。这样能够大大提升网站的性能。

转自：https://blog.csdn.net/LeeSirbupt/article/details/54409931