HTTP协议规格说明定义ETag为“被请求
变量的实体值”。另外一种说法是,ETag是一个能够与Web资源关联的记号(token)。典型的Web资源能够一个Web页,但也多是JSON或XML文档。服务器单独负责判断记号是什么及其含义,并在HTTP响应头中将其传送到
客户端, 如下是服务器端返回的格式:ETag:"50b1c1d4f775c61:df3"客户端的查询更新格式是这样的:If-None-Match : W / "50b1c1d4f775c61:df3"若是ETag没改变,则返回状态304而后不返回,这也和Last-Modified同样。测试Etag主要 在断点下载时比较有用。
Etag
[1]
是URL的Entity Tag,用于标示URL对象是否改变,区分不一样语言和
Session等等。具体内部含义是使
服务器控制的,就像
Cookie那样。
HTTP协议规格说明定义ETag为“被请求
变量的实体值”。另外一种说法是,ETag是一个能够与Web资源关联的记号(token)。典型的Web资源能够一个Web页,但也多是JSON或XML文档。服务器单独负责判断记号是什么及其含义,并在HTTP响应头中将其传送到
客户端, 如下是服务器端返回的格式:ETag:"50b1c1d4f775c61:df3"客户端的查询更新格式是这样的:If-None-Match : W / "50b1c1d4f775c61:df3"若是ETag没改变,则返回状态304而后不返回,这也和Last-Modified同样。测试Etag主要 在断点下载时比较有用。
性能
聪明的服务器开发者会把ETags和GET请求的“If-None-Match”头一块儿使用,这样可利用客户端(例如浏览器)的缓存。由于服务器首先产生ETag,服务器可在稍后使用它来判断页面是否已经被修改。本质上,
客户端经过将该记号传回服务器要求服务器验证其(客户端)缓存。
其过程以下:
客户端请求一个页面(A)。 服务器返回页面A,并在给A加上一个ETag。 客户端展示该页面,并将页面连同ETag一块儿缓存。 客户再次请求页面A,并将上次请求时服务器返回的ETag一块儿传递给服务器。 服务器检查该ETag,并判断出该页面自上次客户端请求以后还未被修改,直接返回响应304(未修改——Not Modified)和一个空的响应体。
优点
一、 有些URL是多语言的网页,相同的URL会返回不一样的东东。还有不一样的Session有不一样的Cookie也就有不一样的内容。这种状况下若是过 Proxy,Proxy就没法区分致使串门,只能简单的取消cache功能。Etag解决了这个问题,由于它能区分相同URL不一样的对象。
二、老的
HTTP标 准里有个Last-Modified+If-Modified-Since代表URL对象是否改变。Etag也具备这种功能,由于对象改变也形成Etag 改变,而且它的控制更加准确。Etag有两种用法 If-Match/If-None-Match,就是若是服务器的对象和客户端的对象ID(不)匹配才执行。这里的If-Match/If-None- Match都能一次提交多个Etag。If-Match能够在Etag未改变时断线重传。If-None-Match能够刷新对象(在有新的Etag时返 回)。
三、Etag中有种Weak Tag,值为 W/"xxxxx"。他声明Tag是弱匹配的,只能作模糊匹配,在差别达到必定阀值时才起做用。
四、Etag对于cache CGI页面颇有用。特别是论坛,论坛有办法为每一个帖子页面生成惟一的Etag,在帖子未改变时,查看话题属性比较Etag就能避免刷新帖子,减小CGI操做和
网络传输。好比论坛中看帖就返回Etag,减小论坛负担。
五、Etag在不一样URL之间没有可比性,也就是不一样URL相同Etag没有特别意义。
请求流程
Etag由服务器端生成,客户端经过If-Match或者说If-None-Match这个条件判断请求来验证资源是否修改。常见的是使用If-None-Match.请求一个文件的流程可能以下:
====第一次请求===
1.客户端发起 HTTP GET 请求一个文件;
2.服务器处理请求,返回文件内容和一堆Header,固然包括Etag(例如"2e681a-6-5d044840")(假设服务器支持Etag生成和已经开启了Etag).状态码200
====第二次请求===
1.客户端发起 HTTP GET 请求一个文件,注意这个时候客户端同时发送一个If-None-Match头,这个头的内容就是第一次请求时服务器返回的Etag:2e681a-6-5d044840
2.服务器判断发送过来的Etag和计算出来的Etag匹配,所以If-None-Match为False,不返回200,返回304,客户端继续使用
本地缓存;
流程很简单,问题是,若是服务器又设置了Cache-Control:max-age和Expires呢,怎么办?
答案是同时使用,也就是说在彻底匹配If-Modified-Since和If-None-Match即检查完修改时间和Etag以后,服务器才能返回304.(不要陷入到底使用谁的问题怪圈)
做用
Etag 主要为了解决 Last-Modified 没法解决的一些问题。
一、一些文件也许会周期性的更改,可是他的内容并不改变(仅仅改变的修改时间),这个时候咱们并不但愿客户端认为这个文件被修改了,而从新GET;
二、某些文件修改很是频繁,好比在秒如下的时间内进行修改,(比方说1s内修改了N次),If-Modified-Since能检查到的粒度是s级的,这种修改没法判断(或者说UNIX记录MTIME只能精确到秒)
三、某些服务器不能精确的获得文件的最后修改时间;
为此,HTTP/1.1引入了 Etag(Entity Tags).Etag仅仅是一个和文件相关的标记,能够是一个版本标记,好比说v1.0.0或者说"2e681a-6-5d044840"这么一串看起来 很神秘的编码。可是HTTP/1.1标准并无规定Etag的内容是什么或者说要怎么实现,惟一
规定的是Etag须要放在""内。
Apache
[2]
首先判断是否是弱Etag,这个留在下面讲。若是不是,进入第二种状况:
强Etag根据配置文件中的配置来设置Etag值,默认的Apache的FileEtag设置为:
FileEtag INode Mtime Size
也就是根据这三个属性来生成Etag值,他们之间经过一些算法来实现,并输出成
hex的格式,相邻属性之间用-分隔,好比:
Etag"2e681a-6-5d044840"
这里面的三个段,分别表明了
INode,
MTime,
Size根据算法算出的值的Hex格式,(若是在这里看到了非Hex里面的字符(也就是0-f),那你可能看见神了:))
固然,能够改变Apache的FileEtag设置,好比设置成FileEtagSize,那么获得的Etag可能为:
Etag"6"
总之,设置了几个段,Etag值就有几个段。(不要误觉得Etag就是固定的3段式)
说明:这里说的都是Apache2.2里面的Etag实现,由于HTTP/1.1并无规定Etag必须是什么样的 实现或者格式,所以,也能够修改或者彻底编写本身的算法获得Etag,好比"2e681a65d044840",客户端会记住并缓存下这个 Etag(Windows里面保存在哪里,下次访问的时候直接拿这个值去和服务器生成的Etag对比。
注意:无论怎么样的算法,在服务器端都要进行计算,计算就有开销,会带来性能损失。所以为了榨干这一点点性能,很多网站彻底把Etag禁用了(好比Yahoo!),这其实不符合HTTP/1.1的规定,由于HTTP/1.1老是鼓励服务器尽量的开启Etag。