CDN原理 运维部落

CDN是什么?   转载:运维部落css

8年前,尚未火车票代售点一说,12306.cn更是无从提及。那时候火车票还只能在火车站的售票大厅购买,而我所住的小县城并不通火车,火车票都要去市里的火车站购买,而从县城到市里,来回就是4个小时车程,简直就是浪费生命。后来就行了,小县城里出现了火车票代售点,能够直接在代售点购买火车,方便了很多,全市人民不再用在一个点苦逼的排队买票了。html

CDN就能够理解为分布在每一个县城的火车票代售点,用户在浏览网站的时候,CDN会选择一个离用户最近的CDN边缘节点来响应用户的请求,这样海南移动用户的请求就不会千里迢迢跑到北京电信机房的服务器(假设源站部署在北京电信机房)上了。前端

CDN的优点jquery

  • (1)CDN节点解决了跨运营商和跨地域访问的问题,访问延时大大下降;浏览器

  • (2)大部分请求在CDN边缘节点完成,CDN起到了分流做用,减轻了源站的负载。缓存

2、缓存是什么?服务器

这里不深究CDN背后高大上的架构,也不讨论CDN如何作到全局流量调度策略,本文着重讨论在有了CDN后,数据是如何被缓存的。缓存是一个处处都存在的用空间换时间的例子。经过使用多余的空间,咱们可以获取更快的速度。架构

首先,看看没有网站没有接入CDN时,用户浏览器与服务器是如何交互的:app

12.png

用户在浏览网站的时候,浏览器可以在本地保存网站中的图片或者其余文件的副本,这样用户再次访问该网站的时候,浏览器就不用再下载所有的文件,减小了下载量意味着提升了页面加载的速度。负载均衡

若是中间加上一层CDN,那么用户浏览器与服务器的交互以下:

4.jpeg

客户端浏览器先检查是否有本地缓存是否过时,若是过时,则向CDN边缘节点发起请求,CDN边缘节点会检测用户请求数据的缓存是否过时,若是没有过时,则直接响应用户请求,此时一个完成http请求结束;若是数据已通过期,那么CDN还须要向源站发出回源请求(back to the source request),来拉取最新的数据。CDN的典型拓扑图以下:

5.jpeg


能够看到,在存在CDN的场景下,数据经历了客户端(浏览器)缓存和CDN边缘节点缓存两个阶段,下面分别对这两个阶段的缓存进行详细的剖析

3、浏览器缓存(客户端)

一、客户端缓存的缺点

客户端缓存减小了的服务器请求,避免了文件重复加载,显著地提高了用户地方。可是当网站发生了更新的时候(如替换了css、js以及图片文件),浏览器本地仍保存着旧版本的文件,从而致使没法预料后果。

曾几什么时候,一个页面加载出来,页面各元素位置乱飘,按钮点击失效,前端GG都会习惯性地问一句:“缓存清了没?”,而后Ctrl+F5       ,Everything is OK。但有些时候,若是咱们是简单地在浏览器地址栏中敲一个回车,或者是仅仅按F5刷新,问题依然没有解决,你可知道这三种不一样的操做方式,决定浏览器不一样的刷新缓存策略?

二、缓存策略

Expires

Expires:Sat, 24 Jan 2015 20:30:54 GMT

6.jpeg

若是http响应报文中设置了Expires,在Expires过时以前,咱们就避免了和服务器之间的链接。此时,浏览器无需想浏览器发出请求,只须要本身判断手中的材料是否过时就能够了,彻底不须要增长服务器的负担。

Cache-control: max-age

7.jpeg

xpires的方法很好,可是咱们每次都得算一个精确的时间。max-age 标签可让咱们更加容易的处理过时时间。咱们只须要说,这份资料你只能用一个星期就能够了。

Max-age 使用秒来计量,如:

Cache-Control:max-age=645672

指定页面645672秒(7.47天)后过时。

Last-Modified

服务器为了通知浏览器当前文件的版本,会发送一个上次修改时间的标签,例如:

Last-Modified:Tue, 06 Jan 2015 08:26:32 GMT

8.jpeg

这样浏览器就知道他收到的这个文件建立时间,在后续的请求中,浏览器会按照下面的规则进行验证:

  • 浏览器:Hey,我须要jquery.min.js这个文件,若是是在 Tue, 06 Jan 2015 08:26:32 GMT 以后修改过的,请发给我。

  • 服务器:(检查文件的修改时间)

  • 服务器:Hey,这个文件在那个时间以后没有被修改过,你已经有最新的版本了。

  • 浏览器:太好了,那我就显示给用户了。

在这种状况下,服务器仅仅返回了一个304的响应头,减小了响应的数据量,提升了响应的速度。关于304响应,请参考:http://www.cnblogs.com/ziyunfei/archive/2012/11/17/2772729.html,下图是按F5刷新页面后,页面返回304响应头。

9.jpeg

ETag

一般状况下,经过修改时间来比较文件是可行的。可是在一些特殊状况,例如服务器的时钟发生了错误,服务器时钟进行修改,夏时制DST到来后服务器时间没有及时更新,这些都会引发经过修改时间比较文件版本的问题。

ETag能够用来解决这种问题。ETag是一个文件的惟一标志符。就像一个哈希或者指纹,每一个文件都有一个单独的标志,只要这个文件发生了改变,这个标志就会发生变化。

服务器返回ETag标签:

ETag:”39001d-1762a-50bf790757e00”

10.jpeg

接下来的访问顺序以下所示:

  1. 浏览器:Hey,我须要jquery.min.js这个文件,有没有不匹配”39001d-1762a-50bf790757e00”这个串的

  2. 服务器:(检查ETag…)

  3. 服务器:Hey,我这里的版本也是”39001d-1762a-50bf790757e00”,你已是最新的版本了

  4. 浏览器:好,那就可使用本地缓存了

如同 Last-modified 同样,ETag 解决了文件版本比较的问题。只不过 ETag 的级别比 Last-Modified 高一些。

额外的标签

缓存标签永远不会中止工做,可是有时候咱们须要对已经缓存的内容进行一些控制。

  • Cache-control: public 表示缓存的版本能够被代理服务器或者其余中间服务器识别。

  • Cache-control: private 意味着这个文件对不一样的用户是不一样的。只有用户本身的浏览器可以进行缓存,公共的代理服务器不容许缓存。

  • Cache-control: no-cache 意味着文件的内容不该当被缓存。这在搜索或者翻页结果中很是有用,由于一样的URL,对应的内容会发生变化。

11.jpeg

三、浏览器缓存刷新

在地址栏中输入网址后按回车或点击转到按钮

浏览器以最少的请求来获取网页的数据,浏览器会对全部没有过时的内容直接使用本地缓存,从而减小了对浏览器的请求。因此,Expires,max-age标记只对这种方式有效。

按F5或浏览器刷新按钮

浏览器会在请求中附加必要的缓存协商,但不容许浏览器直接使用本地缓存,它可以让 Last-Modified、ETag发挥效果,可是对Expires无效。

按Ctrl+F5或按Ctrl并点击刷新按钮

这种方式就是强制刷新,总会发起一个全新的请求,不使用任何缓存。

4、CDN缓存

浏览器本地缓存失效后,浏览器会向CDN边缘节点发起请求。相似浏览器缓存,CDN边缘节点也存在着一套缓存机制。

一、CDN缓存原理描述

  1. 用户输入URL,浏览器将解析事后的域名发给DNS服务器

  2. CDN返回该域名对应的CNAME,此时浏览器须要再次对得到的CNAME进行解析,才能获得CDN缓存服务器的IP地址。在此过程当中全局负载均衡DNS解析服务器会将用户的访问请求定位到离用户最近、负载最轻的CDN缓存服务器上。这种技术也被称为“DNS重定向”,DNS服务器不是为每一个请求返回相同的IP地址,好比在悉尼的一个客户请求解析www.cdn.com,DNS服务器根据地理位置,计算出距离这个用户最近的CDN服务器,因而返回一个悉尼CDN节点的IP地址。这种方法也不必定是最优的,由于地理位置上最近的两个点,延迟可能反而很高。还有一种方法是经过估计节点间的样本延迟,具体原理我也不了解。

  3. 再次解析后,浏览器获得CDN缓存服务器的实际IP地址,向缓存服务器发起请求。

  4. 缓存服务器根据浏览器提供的域名,经过内部DNS解析获得此域名源服务器的真实IP地址,再由缓存服务器向该服务器发起访问请求。

  5. 缓存服务器拿到数据后,一方面将数据发回浏览器,另外一方面进行本地保存,以备后用。以后再次访问,数据将从CDN缓存服务器中被返回。CDN不会永久保存数据,能够设置CDN的刷新频率,来达到数据的更新。

  6. 浏览器获得由缓存服务器发回的数据,并将其显示出来。至此,完成整个域名访问的过程。

二、CDN缓存的缺点

CDN的分流做用不只减小了用户的访问延时,也减小的源站的负载。但其缺点也很明显:当网站更新时,若是CDN节点上数据没有及时更新,即使用户再浏览器使用Ctrl +F5的方式使浏览器端的缓存失效,也会由于CDN边缘节点没有同步最新数据而致使用户访问异常。

三、CDN缓存策略

CDN边缘节点缓存策略因服务商不一样而不一样,但通常都会遵循http标准协议,经过http响应头中的Cache-control: max-age的字段来设置CDN边缘节点数据缓存时间。

当客户端向CDN节点请求数据时,CDN节点会判断缓存数据是否过时,若缓存数据并无过时,则直接将缓存数据返回给客户端;不然,CDN节点就会向源站发出回源请求,从源站拉取最新数据,更新本地缓存,并将最新数据返回给客户端。

CDN服务商通常会提供基于文件后缀、目录多个维度来指定CDN缓存时间,为用户提供更精细化的缓存管理。

CDN缓存时间会对“回源率”产生直接的影响。若CDN缓存时间较短,CDN边缘节点上的数据会常常失效,致使频繁回源,增长了源站的负载,同时也增大的访问延时;若CDN缓存时间太长,会带来数据更新时间慢的问题。开发者须要增对特定的业务,来作特定的数据缓存时间管理。

四、CDN缓存刷新

CDN边缘节点对开发者是透明的,相比于浏览器Ctrl+F5的强制刷新来使浏览器本地缓存失效,开发者能够经过CDN服务商提供的“刷新缓存”接口来达到清理CDN边缘节点缓存的目的。这样开发者在更新数据后,可使用“刷新缓存”功能来强制CDN节点上的数据缓存过时,保证客户端在访问时,拉取到最新的数据。

相关文章
相关标签/搜索