TCP/IP基础总结性学习(6)

HTTP 首部

一. HTTP 报文首部css

1.HTTP 报文的结构:
clipboard.pnghtml

2.HTTP 请求报文web

  • 图示:

clipboard.png

  • 举例子:

clipboard.png

3.HTTP 响应报文:面试

  • 下面的示例是访问 http://hackr.jp 时,请求报文的首部信息:

clipboard.png

  • 如下示例是以前请求访问 http://hackr.jp/ 时,返回的响应报文的首部信息:

clipboard.png

在报文众多的字段当中,HTTP 首部字段包含的信息最为丰富。首部字段同时存在于请求和响应报文内,并涵盖 HTTP 报文相关的内容信息。

二. HTTP 首部字段 算法

1.HTTP 首部字段传递重要信息:apache

  • HTTP 首部字段是构成 HTTP 报文的要素之一。在客户端与服务器之间以 HTTP 协议进行通讯的过程当中,不管是请求仍是响应都会使用首部字段,它能起到传递额外重要信息的做用。使用首部字段是为了给浏览器和服务器提供报文主体大小、所使用的 语言、认证信息等内容。
  • 图:首部字段内可以使用的附加信息较多

    clipboard.png

2.HTTP 首部字段结构 :segmentfault

  • HTTP 首部字段是由首部字段名和字段值构成的,中间用冒号“:” 分 隔。

clipboard.png

  • 例如,在 HTTP 首部中以 Content-Type 这个字段来表示报文主体的对象类型。

clipboard.png

  • 就以上述示例来看,首部字段名为 Content-Type,字符串 text/html 是 字段值。
  • 另外,字段值对应单个 HTTP 首部字段能够有多个值,以下所示。

clipboard.png

  • 注意:若 HTTP 首部字段重复了会如何当 HTTP 报文首部中出现了两个或两个以上具备相同首部字段名时会怎么样?这种状况在规范内还没有明确,根据浏览器内部处理逻辑的不一样,结果可能并不一致。有些浏览器会优先处理第一次出现的首部字段,而有些则会优先处理最后出现的首部字段。

3.4 种 HTTP 首部字段类型:
HTTP 首部字段根据实际用途被分为如下 4 种类型。浏览器

  • 通用首部字段(General Header Fields)

请求报文和响应报文两方都会使用的首部。缓存

  • 请求首部字段(Request Header Fields)

从客户端向服务器端发送请求报文时使用的首部。补充了请求的附加内容、客户端信息、响应内容相关优先级等信息。安全

  • 响应首部字段(Response Header Fields)

从服务器端向客户端返回响应报文时使用的首部。补充了响应的附加内容,也会要求客户端附加额外的内容信息。

  • 实体首部字段(Entity Header Fields)

针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新时间等与实体有关的信息。

4.HTTP/1.1 首部字段一览

HTTP/1.1 规范定义了以下 47 种首部字段。
  • 通用首部字段

clipboard.png

  • 请求首部字段

clipboard.png

  • 响应首部字段

clipboard.png

  • 实体首部字段

clipboard.png

5.非 HTTP/1.1 首部字段

  • 在 HTTP 协议通讯交互中使用到的首部字段,不限于 RFC2616 中定义的 47 种首部字段。还有 Cookie、Set-Cookie 和 Content-Disposition 等在其余 RFC 中定义的首部字段,它们的使用频率也很高。 这些非正式的首部字段统一概括在 RFC4229 HTTP Header Field Registrations 中。 6.2.6 End-to-end 首部和 Hop-by-hop 首部 HTTP 首部字段将定义成缓存代理和非缓存代理的行为,分红 2 种类型。

端到端首部(End-to-end Header) 分在此类别中的首部会转发给请求 / 响应对应的最终接收目标,且必须保存在由缓存生成的响应中,另外规定它必须被转发。
逐跳首部(Hop-by-hop Header)
分在此类别中的首部只对单次转发有效,会因经过缓存或代理而再也不转发。HTTP/1.1 和以后版本中,若是要使用 hop-by-hop 首部,需提供 Connection 首部字段。
下面列举了 HTTP/1.1 中的逐跳首部字段。除这 8 个首部字段以外, 其余全部字段都属于端到端首部。
注意:下面列举了 HTTP/1.1 中的逐跳首部字段。除这 8 个首部字段以外, 其余全部字段都属于端到端首部。
Connection
Keep-Alive
Proxy-Authenticate
Proxy-Authorization
Trailer
TE
Transfer-Encoding
Upgrade


三.HTTP/1.1 通用首部字段
1.Cache-Control 经过指定首部字段 ,Cache-Control 的指令,就能操做缓存的工做机制。

  • 图:首部字段 Cache-Control 可以控制缓存的行为

clipboard.png

  • 指令的参数是可选的,多个指令之间经过“,”分隔。首部字段 CacheControl 的指令可用于请求及响应时。

clipboard.png

  • Cache-Control 指令一览

缓存请求指令:
clipboard.png
缓存响应指令:

clipboard.png

表示是否能缓存的指令:
public 指令

clipboard.png
当指定使用 public 指令时,则明确代表其余用户也可利用缓存。

private 指令

clipboard.png

clipboard.png

no-cache 指令

clipboard.png

clipboard.png
客户端发送的请求中若是包含 no-cache 指令,则表示客户端将不会接收缓存过的响应。因而,“中间”的缓存服务器必须把客户端请求转发给源服务器。若是服务器返回的响应中包含 no-cache 指令,那么缓存服务器不能对资源进行缓存。源服务器之后也将再也不对缓存服务器请求中提出的资源有效性进行确认,且禁止其对响应资源进行缓存操做。

clipboard.png

由服务器返回的响应中,若报文首部字段 Cache-Control 中对 no-cache 字段名具体指定参数值,那么客户端在接收到这个被指定参数值的首部字段对应的响应报文后,就不能使用缓存。换言之,无参数值的首部字段可使用缓存。只能在响应指令中指定该参数。

控制可执行缓存的对象的指令:

no-store 指令

clipboard.png

当使用 no-store 指令(从字面意思上很容易把 no-cache 误解成为不缓存,但事实上 no-cache 表明不缓存过时的资源,缓存会向源服务器进行有效期确认后处理资源,也许称为 do-notserve-from-cache-without-revalidation 更合适。no-store 才是真正地不进行缓存,请读者注意区别理解。) 时,暗示请求(和对应的响应)或响应中包含机密信息。所以,该指令规定缓存不能在本地存储请求或响应的任一部分。

指定缓存期限和认证的指令

s-maxage 指令

clipboard.png

s-maxage 指令的功能和 max-age 指令的相同,它们的不一样点是 smaxage 指令只适用于供多位用户使用的公共缓存服务器(这里通常指代理) 。也就是说,对于向同一用户重复返回响应的服务器来讲,这个指令没有任何做用。另外,当使用 s-maxage 指令后,则直接忽略对 Expires 首部字段及 max-age 指令的处理。

max-age 指令

clipboard.png

clipboard.png

当客户端发送的请求中包含 max-age 指令时,若是断定缓存资源的缓存时间数值比指定时间的数值更小,那么客户端就接收缓存的资源。 另外,当指定 max-age 值为 0,那么缓存服务器一般须要将请求转发给源服务器。当服务器返回的响应中包含 max-age 指令时,缓存服务器将不对资源的有效性再做确认,而 max-age 数值表明资源保存为缓存的最长时间。应用 HTTP/1.1 版本的缓存服务器遇到同时存在 Expires 首部字段的状况时,会优先处理 max-age 指令,而忽略掉 Expires 首部字段。而 HTTP/1.0 版本的缓存服务器的状况却相反,max-age 指令会被忽略。

min-fresh 指令

clipboard.png

min-fresh 指令要求缓存服务器返回至少还未过指定时间的缓存资源。 好比,当指定 min-fresh 为 60 秒后,过了 60 秒的资源都没法做为响应返回了。

max-stale 指令

clipboard.png

使用 max-stale 可指示缓存资源,即便过时也照常接收。若是指令未指定参数值,那么不管通过多久,客户端都会接收响应; 若是指令中指定了具体数值,那么即便过时,只要仍处于 max-stale 指定的时间内,仍旧会被客户端接收。

only-if-cached 指令

clipboard.png
使用 only-if-cached 指令表示客户端仅在缓存服务器本地缓存目标资源的状况下才会要求其返回。换言之,该指令要求缓存服务器不从新加载响应,也不会再次确认资源有效性。若发生请求缓存服务器的本地缓存无响应,则返回状态码 504 Gateway Timeout。

must-revalidate 指令

clipboard.png

使用 must-revalidate 指令,代理会向源服务器再次验证即将返回的响应缓存目前是否仍然有效。若代理没法连通源服务器再次获取有效资源的话,缓存必须给客户端 一条 504(Gateway Timeout)状态码。 另外,使用 must-revalidate 指令会忽略请求的 max-stale 指令(即便已经在首部使用了 max-stale,也不会再有效果)。

proxy-revalidate 指令

clipboard.png

proxy-revalidate 指令要求全部的缓存服务器在接收到客户端带有该指令的请求返回响应以前,必须再次验证缓存的有效性。

no-transform 指令

clipboard.png

使用 no-transform 指令规定不管是在请求仍是响应中,缓存都不能改变实体主体的媒体类型。
这样作可防止缓存或代理压缩图片等相似操做。

Cache-Control 扩展
cache-extension token
clipboard.png

经过 cache-extension 标记(token),能够扩展 Cache-Control 首部字段内的指令。
如上例,Cache-Control 首部字段自己没有 community 这个指令。借助 extension tokens 实现了该指令的添加。若是缓存服务器不能理解 community 这个新指令,就会直接忽略。所以,extension tokens 仅对能理解它的缓存服务器来讲是有意义的。

2.Connection

Connection 首部字段具有以下两个做用:
 

  • 控制再也不转发给代理的首部字段

clipboard.png

在客户端发送请求和服务器返回响应内,使用 Connection 首部字段,可控制再也不转发给代理的首部字段(即 Hop-by-hop 首 部)

  • 管理持久链接

HTTP/1.1 版本的默认链接都是持久链接。为此,客户端会在持久链接上连续发送请求。当服务器端想明确断开链接时,则指定 Connection 首部字段的值为 Close。
clipboard.png

HTTP/1.1 以前的 HTTP 版本的默认链接都是非持久链接。为此,若是想在旧版本的 HTTP 协议上维持持续链接,则须要指定 Connection 首部字段的值为 Keep-Alive。
如上图①所示,客户端发送请求给服务器时,服务器端会像上图 ②那样加上首部字段 Keep-Alive 及首部字段 Connection 后返回响应。

3.Date

  • 首部字段 Date 代表建立 HTTP 报文的日期和时间。
  • HTTP/1.1 协议使用在 RFC1123 中规定的日期时间的格式,以下示例:

clipboard.png

  • 以前的 HTTP 协议版本中使用在 RFC850 中定义的格式,以下所示:

clipboard.png

  • 除此以外,还有一种格式。它与 C 标准库内的 asctime() 函数的输出格式一致:

clipboard.png

4.Pragma

  • Pragma 是 HTTP/1.1 以前版本的历史遗留字段,仅做为与 HTTP/1.0 的向后兼容而定义。
  • 规范定义的形式惟一,以下所示。

clipboard.png

  • 该首部字段属于通用首部字段,但只用在客户端发送的请求中。客户端会要求全部的中间服务器不返回缓存的资源。

clipboard.png

全部的中间服务器若是都能以 HTTP/1.1 为基准,那直接采用 CacheControl: no-cache 指定缓存的处理方式是最为理想的。但要总体掌握所有中间服务器使用的 HTTP 协议版本倒是不现实的。所以,发送的 请求会同时含有下面两个首部字段。

5.Trailer

clipboard.png

  • 首部字段 Trailer 会事先说明在报文主体后记录了哪些首部字段。该首部字段可应用在 HTTP/1.1 版本分块传输编码时。

clipboard.png

以上用例中,指定首部字段 Trailer 的值为 Expires,在报文主体以后(分块长度 0 以后)出现了首部字段 Expires。

6.Transfer-Encoding

clipboard.png

  • 首部字段 Transfer-Encoding 规定了传输报文主体时采用的编码方式。 HTTP/1.1 的传输编码方式仅对分块传输编码有效。

clipboard.png

以上用例中,正如在首部字段 Transfer-Encoding 中指定的那样,有效使用分块传输编码,且分别被分红 3312 字节和 914 字节大小的分块数据。

7.Upgrade

  • 首部字段 Upgrade 用于检测 HTTP 协议及其余协议是否可以使用更高的版本进行通讯,其参数值能够用来指定一个彻底不一样的通讯协议。

clipboard.png

上图用例中,首部字段 Upgrade 指定的值为 TLS/1.0。请注意此处两个字段首部字段的对应关系,Connection 的值被指定为 Upgrade。 Upgrade 首部字段产生做用的 Upgrade 对象仅限于客户端和邻接服务器之间。所以,使用首部字段 Upgrade 时,还须要额外指定 Connection:Upgrade。 对于附有首部字段 Upgrade 的请求,服务器可用 101 Switching Protocols 状态码做为响应返回。

8.Via

  • 使用首部字段 Via 是为了追踪客户端与服务器之间的请求和响应报文的传输路径。报文通过代理或网关时,会先在首部字段 Via 中附加该服务器的信息,而后再进行转发。这个作法和 traceroute 及电子邮件的 Received 首部的工做机制很相似。首部字段 Via 不只用于追踪报文的转发,还可避免请求回环的发生。 因此必须在通过代理时附加该首部字段内容。

clipboard.png

上图用例中,在通过代理服务器 A 时,Via 首部附加了“1.0 gw.hackr.jp (Squid/3.1)”这样的字符串值。行头的 1.0 是指接收请求的服务器上应用的 HTTP 协议版本。接下来通过代理服务器 B 时亦是如此,在 Via 首部附加服务器信息,也可增长 1 个新的 Via 首部写入服务器信息。Via 首部是为了追踪传输路径,因此常常会和 TRACE 方法一块儿使 用。好比,代理服务器接收到由 TRACE 方法发送过来的请求(其中 Max-Forwards: 0)时,代理服务器就不能再转发该请求了。这种状况下,代理服务器会将自身的信息附加到 Via 首部后,返回该请求的响应。
9.Warning

  • HTTP/1.1 的 Warning 首部是从 HTTP/1.0 的响应首部(Retry-After)演变过来的。该首部一般会告知用户一些与缓存相关的问题的警告。

clipboard.png

  • Warning 首部的格式以下。最后的日期时间部分可省略。

clipboard.png

  • HTTP/1.1 中定义了 7 种警告。警告码对应的警告内容仅推荐参考。 另外,警告码具有扩展性,从此有可能追加新的警告码。

clipboard.png


四.请求首部字段

  • 请求首部字段是从客户端往服务器端发送请求报文中所使用的字段, 用于补充请求的附加信息、客户端信息、对响应内容相关的优先级等内容。

1. Accept

clipboard.png

  • Accept 首部字段可通知服务器,用户代理可以处理的媒体类型及媒体类型的相对优先级。可以使用 type/subtype 这种形式,一次指定多种媒体类型

文本文件
text/html, text/plain, text/css ... application/xhtml+xml, application/xml ...
图片文件
image/jpeg, image/gif, image/png ...
视频文件
video/mpeg, video/quicktime ...
应用程序使用的二进制文件
application/octet-stream, application/zip ...

  • 若想要给显示的媒体类型增长优先级,则使用 q= 来额外表示权重值 (原文是“品質係数”。在 RFC2616 定义中,此处的 q 是指 qvalue,即 quality factor。直译的话就是质量数,但通过综合考虑理解记忆的便利性后,彷佛采用权 重值更为稳妥。),用分号(;)进行分隔。权重值 q 的范围是 0~1(可精确到小数点后 3 位),且 1 为最大值。不指定权重 q 值时,默认权重为 q=1.0。当服务器提供多种内容时,将会首先返回权重值最高的媒体类型。

2.Accept-Charset

clipboard.png

  • Accept-Charset 首部字段可用来通知服务器用户代理支持的字符集及字符集的相对优先顺序。另外,可一次性指定多种字符集。与首部字段 Accept 相同的是可用权重 q 值来表示相对优先级。该首部字段应用于内容协商机制的服务器驱动协商。

3.Accept-Encoding

clipboard.png

  • Accept-Encoding 首部字段用来告知服务器用户代理支持的内容编码及内容编码的优先级顺序。可一次性指定多种内容编码。
  • 下面试举出几个内容编码的例子。

gzip
由文件压缩程序 gzip(GNU zip)生成的编码格式 (RFC1952),采用 Lempel-Ziv 算法(LZ77)及 32 位循环冗余校验(Cyclic Redundancy Check,通称 CRC)。
compress
由 UNIX 文件压缩程序 compress 生成的编码格式,采用 LempelZiv-Welch 算法(LZW)。 deflate
组合使用 zlib 格式(RFC1950)及由 deflate 压缩算法 (RFC1951)生成的编码格式。 identity
不执行压缩或不会变化的默认编码格式

  • 采用权重 q 值来表示相对优先级,这点与首部字段 Accept 相同。另外,也可以使用星号(*)做为通配符,指定任意的编码格式。

4.Accept-Language

clipboard.png

  • 首部字段 Accept-Language 用来告知服务器用户代理可以处理的天然语言集(指中文或英文等),以及天然语言集的相对优先级。可一次指定多种天然语言集。和 Accept 首部字段同样,按权重值 q 来表示相对优先级。在上述图例中,客户端在服务器有中文版资源的状况下,会请求其返回中文版对应的响应,没有中文版时,则请求返回英文版响应。

5.Authorization

clipboard.png

  • 首部字段 Authorization 是用来告知服务器,用户代理的认证信息(证书值)。一般,想要经过服务器认证的用户代理会在接收到返回的 401 状态码响应后,把首部字段 Authorization 加入请求中。共用缓存在接收到含有 Authorization 首部字段的请求时的操做处理会略有差别。

6.Expect

clipboard.png

  • 客户端使用首部字段 Expect 来告知服务器,指望出现的某种特定行为。因服务器没法理解客户端的指望做出回应而发生错误时,会返回状态码 417 Expectation Failed。客户端能够利用该首部字段,写明所指望的扩展。虽然 HTTP/1.1 规范只定义了 100-continue(状态码 100 Continue 之意)。等待状态码 100 响应的客户端在发生请求时,须要指定 Expect:100continue。

7.From

clipboard.png

  • 首部字段 From 用来告知服务器使用用户代理的用户的电子邮件地址。一般,其使用目的就是为了显示搜索引擎等用户代理的负责人的电子邮件联系方式。使用代理时,应尽量包含 From 首部字段(但可能会因代理不一样,将电子邮件地址记录在 User-Agent 首部字段内)。

8. Host

clipboard.png

  • 首部字段 Host 会告知服务器,请求的资源所处的互联网主机名和端口号。Host 首部字段在 HTTP/1.1 规范内是惟一一个必须被包含在请求内的首部字段。首部字段 Host 和以单台服务器分配多个域名的虚拟主机的工做机制有很密切的关联,这是首部字段 Host 必须存在的意义。 请求被发送至服务器时,请求中的主机名会用 IP 地址直接替换解决。但若是这时,相同的 IP 地址下部署运行着多个域名,那么服务器就会没法理解到底是哪一个域名对应的请求。所以,就须要使用首部字段 Host 来明确指出请求的主机名。若服务器未设定主机名,那直接发送一个空值便可。以下所示:

clipboard.png

9.If-Match

clipboard.png

  • 形如 If-xxx 这种样式的请求首部字段,均可称为条件请求。服务器接收到附带条件的请求后,只有判断指定条件为真时,才会执行请求。

clipboard.png

clipboard.png

  • 首部字段 If-Match,属附带条件之一,它会告知服务器匹配资源所用的实体标记(ETag)值。这时的服务器没法使用弱 ETag 值。服务器会比对 If-Match 的字段值和资源的 ETag 值,仅当二者一致 时,才会执行请求。反之,则返回状态码 412 Precondition Failed 的响 应。还可使用星号(*)指定 If-Match 的字段值。针对这种状况,服务器将会忽略 ETag 的值,只要资源存在就处理请求。

10.If-Modified-Since

clipboard.png

clipboard.png

首部字段 If-Modified-Since,属附带条件之一,它会告知服务器若 IfModified-Since 字段值早于资源的更新时间,则但愿能处理该请求。 而在指定 If-Modified-Since 字段值的日期时间以后,若是请求的资源都没有过更新,则返回状态码 304 Not Modified 的响应。 If-Modified-Since 用于确认代理或客户端拥有的本地资源的有效性。 获取资源的更新日期时间,可经过确认首部字段 Last-Modified 来肯定。

11.If-None-Match

clipboard.png

  • 图:只有在 If-None-Match 的字段值与 ETag 值不一致时,可处理 该请求。与 If-Match 首部字段的做用相反 首部字段 If-None-Match 属于附带条件之一。它和首部字段 If-Match 做用相反。用于指定 If-None-Match 字段值的实体标记(ETag)值与 请求资源的 ETag 不一致时,它就告知服务器处理该请求。 在 GET 或 HEAD 方法中使用首部字段 If-None-Match 可获取最新的资 源。所以,这与使用首部字段 If-Modified-Since 时有些相似。

12.If-Range

clipboard.png

  • 首部字段 If-Range 属于附带条件之一。它告知服务器若指定的 IfRange 字段值(ETag 值或者时间)和请求资源的 ETag 值或时间相一 致时,则做为范围请求处理。反之,则返回全体资源。

clipboard.png

  • 下面咱们思考一下不使用首部字段 If-Range 发送请求的状况。服务器端的资源若是更新,那客户端持有资源中的一部分也会随之无效,固然,范围请求做为前提是无效的。这时,服务器会暂且以状态码 412 Precondition Failed 做为响应返回,其目的是催促客户端再次发送请 求。这样一来,与使用首部字段 If-Range 比起来,就须要花费两倍的功夫。

13.If-Unmodified-Since

clipboard.png

  • 首部字段 If-Unmodified-Since 和首部字段 If-Modified-Since 的做用相 反。它的做用的是告知服务器,指定的请求资源只有在字段值内指定 的日期时间以后,未发生更新的状况下,才能处理请求。若是在指定 日期时间后发生了更新,则以状态码 412 Precondition Failed 做为响应 返回

14.Max-Forwards

clipboard.png

  • 经过 TRACE 方法或 OPTIONS 方法,发送包含首部字段 MaxForwards 的请求时,该字段以十进制整数形式指定可通过的服务器最大数目。服务器在往下一个服务器转发请求以前,Max-Forwards 的值减 1 后从新赋值。当服务器接收到 Max-Forwards 值为 0 的请求 时,则再也不进行转发,而是直接返回响应。使用 HTTP 协议通讯时,请求可能会通过代理等多台服务器。途中,若是代理服务器因为某些缘由致使请求转发失败,客户端也就等不到服务器返回的响应了。对此,咱们无从可知。能够灵活使用首部字段 Max-Forwards,针对以上问题产生的缘由展开调查。因为当 Max-Forwards 字段值为 0 时,服务器就会当即返回响应,由此咱们至少能够对以那台服务器为终点的传输路径的通讯情况有所把握。

clipboard.png

clipboard.png

15.Proxy-Authorization

clipboard.png

  • 接收到从代理服务器发来的认证质询时,客户端会发送包含首部字段 Proxy-Authorization 的请求,以告知服务器认证所须要的信息。 这个行为是与客户端和服务器之间的 HTTP 访问认证相相似的,不一样之处在于,认证行为发生在客户端与代理之间。客户端与服务器之间的认证,使用首部字段 Authorization 可起到相同做用。

16.Range

clipboard.png

  • 对于只需获取部分资源的范围请求,包含首部字段 Range 便可告知服务器资源的指定范围。上面的示例表示请求获取从第 5001 字节至第 10000 字节的资源。接收到附带 Range 首部字段请求的服务器,会在处理请求以后返回状态码为 206 Partial Content 的响应。没法处理该范围请求时,则会返回状态码 200 OK 的响应及所有资源。

17.Referer

clipboard.png

  • 首部字段 Referer 会告知服务器请求的原始资源的 URI。 客户端通常都会发送 Referer 首部字段给服务器。但当直接在浏览器的地址栏输入 URI,或出于安全性的考虑时,也能够不发送该首部字段。由于原始资源的 URI 中的查询字符串可能含有 ID 和密码等保密信息,要是写进 Referer 转发给其余服务器,则有可能致使保密信息的泄露。另外,Referer 的正确的拼写应该是 Referrer,但不知为什么,你们一直沿用这个错误的拼写。

18.TE

clipboard.png

  • 首部字段 TE 会告知服务器客户端可以处理响应的传输编码方式及相对优先级。它和首部字段 Accept-Encoding 的功能很相像,可是用于传输编码。首部字段 TE 除指定传输编码以外,还能够指定伴随 trailer 字段的分 块传输编码的方式。应用后者时,只需把 trailers 赋值给该字段值。

clipboard.png

19.User-Agent

clipboard.png

  • 首部字段 User-Agent 会将建立请求的浏览器和用户代理名称等信息传达给服务器。由网络爬虫发起请求时,有可能会在字段内添加爬虫做者的电子邮件地址。此外,若是请求通过代理,那么中间也极可能被添加上代理服务器的名称。

五.响应首部字段

  • 响应首部字段是由服务器端向客户端返回响应报文中所使用的字段, 用于补充响应的附加信息、服务器信息,以及对客户端的附加要求等信息。

1.Accept-Ranges

clipboard.png

  • 首部字段 Accept-Ranges 是用来告知客户端服务器是否能处理范围请求,以指定获取服务器端某个部分的资源。可指定的字段值有两种,可处理范围请求时指定其为 bytes,反之则 指定其为 none。

2.Age

clipboard.png

  • 首部字段 Age 能告知客户端,源服务器在多久前建立了响应。字段值的单位为秒。

若建立该响应的服务器是缓存服务器,Age 值是指缓存后的响应再次发起认证到认证完成的时间值。代理建立响应时必须加上首部字段 Age。

3.ETag

clipboard.png

  • 首部字段 ETag 能告知客户端实体标识。它是一种可将资源以字符串形式作惟一性标识的方式。服务器会为每份资源分配对应的 ETag 值。另外,当资源更新时,ETag 值也须要更新。生成 ETag 值时,并无统一的算法规则,而仅仅是由服务器来分配。

clipboard.png

  • 资源被缓存时,就会被分配惟一性标识。例如,当使用中文版的浏览器访问 http://www.google.com/ 时,就会返回中文版对应的资源,而使用英文版的浏览器访问时,则会返回英文版对应的资源。二者的 URI 是相同的,因此仅凭 URI 指定缓存的资源是至关困难的。若在下载过程当中出现链接中断、再链接的状况,都会依照 ETag 值来指定资 源。

强 ETag 值和弱 Tag 值

强 ETag 值不论实体发生多么细微的变化都会改变其值。
clipboard.png

弱 ETag 值只用于提示资源是否相同。只有资源发生了根本改变,产生差别时才会改变 ETag 值。这时,会在字段值最开始处附加 W/。

clipboard.png

4.Location

clipboard.png

  • 使用首部字段 Location 能够将响应接收方引导至某个与请求 URI 位置不一样的资源。基本上,该字段会配合 3xx :Redirection 的响应,提供重定向的 URI。 几乎全部的浏览器在接收到包含首部字段 Location 的响应后,都会强制性地尝试对已提示的重定向资源的访问。

5.Proxy-Authenticate

clipboard.png

  • 首部字段 Proxy-Authenticate 会把由代理服务器所要求的认证信息发送给客户端。

它与客户端和服务器之间的 HTTP 访问认证的行为类似,不一样之处在于其认证行为是在客户端与代理之间进行的。而客户端与服务器之间 进行认证时,首部字段 WWW-Authorization 有着相同的做用。

6.Retry-After

clipboard.png

  • 首部字段 Retry-After 告知客户端应该在多久以后再次发送请求。主要配合状态码 503 Service Unavailable 响应,或 3xx Redirect 响应一块儿使用。

字段值能够指定为具体的日期时间(Wed, 04 Jul 2012 06:34:24 GMT 等格式),也能够是建立响应后的秒数。

7.Server

clipboard.png

  • 首部字段 Server 告知客户端当前服务器上安装的 HTTP 服务器应用程序的信息。不仅仅会标出服务器上的软件应用名称,还有可能包括版本号和安装时启用的可选项。

clipboard.png

8.Vary

  • 图:当代理服务器接收到带有 Vary 首部字段指定获取资源的请求时,若是使用的Accept-Language 字段的值相同,那么就直接从缓存返回响应。反之,则须要先从源服务器端获取资源后才能做响应返回。

clipboard.png

  • 首部字段 Vary 可对缓存进行控制。源服务器会向代理服务器传达关于本地缓存使用方法的命令。从代理服务器接收到源服务器返回包含 Vary 指定项的响应以后,若再要进行缓存,仅对请求中含有相同 Vary 指定首部字段的请求返回缓存。即便对相同资源发起请求,但因为 Vary 指定的首部字段不相同,所以必需要从源服务器从新获取资源。

clipboard.png

9.WWW-Authenticate

clipboard.png

  • 首部字段 WWW-Authenticate 用于 HTTP 访问认证。它会告知客户端适用于访问请求 URI 所指定资源的认证方案(Basic 或是 Digest)和带参数提示的质询(challenge)。状态码 401 Unauthorized 响应中,确定带有首部字段 WWW-Authenticate。 上述示例中,realm 字段的字符串是为了辨别请求 URI 指定资源所受到的保护策略。

六.实体首部字段

  • 实体首部字段是包含在请求报文和响应报文中的实体部分所使用的首部,用于补充内容的更新时间等与实体相关的信息。

1.Allow

clipboard.png

  • 首部字段 Allow 用于通知客户端可以支持 Request-URI 指定资源的全部 HTTP 方法。当服务器接收到不支持的 HTTP 方法时,会以状态码 405 Method Not Allowed 做为响应返回。与此同时,还会把全部能支持的 HTTP 方法写入首部字段 Allow 后返回。

2.Content-Encoding

clipboard.png

  • 首部字段 Content-Encoding 会告知客户端服务器对实体的主体部分选用的内容编码方式。内容编码是指在不丢失实体信息的前提下所进行的压缩。

clipboard.png

  • 主要采用如下 4 种内容编码的方式。

gzip
compress
deflate
identity

3.Content-Language

clipboard.png

  • 首部字段 Content-Language 会告知客户端,实体主体使用的天然语言(指中文或英文等语言)。

4.Content-Length

clipboard.png

  • 首部字段 Content-Length 代表了实体主体部分的大小(单位是字节)。对实体主体进行内容编码传输时,不能再使用 Content-Length 首部字段。因为实体主体大小的计算方法略微复杂,因此在此再也不展开。

5.Content-Location

clipboard.png

  • 首部字段 Content-Location 给出与报文主体部分相对应的 URI。和首部字段 Location 不一样,Content-Location 表示的是报文主体返回资源对应的 URI。 好比,对于使用首部字段 Accept-Language 的服务器驱动型请求,当返回的页面内容与实际请求的对象不一样时,首部字段 Content-Location 内会写明 URI。(访问 http://www.hackr.jp/ 返回的对象倒是 http://www.hackr.jp/index-ja.... 等相似状况)

6.Content-MD5

clipboard.png

  • 首部字段 Content-MD5 是一串由 MD5 算法生成的值,其目的在于检查报文主体在传输过程当中是否保持完整,以及确认传输到达。对报文主体执行 MD5 算法得到的 128 位二进制数,再经过 Base64 编码后将结果写入 Content-MD5 字段值。因为 HTTP 首部没法记录二进制值,因此要经过 Base64 编码处理。为确保报文的有效性,做为接收方的客户端会对报文主体再执行一次相同的 MD5 算法。计算出的值与字段值做比较后,便可判断出报文主体的准确性。采用这种方法,对内容上的偶发性改变是无从查证的,也没法检测出恶意篡改。其中一个缘由在于,内容若是可以被篡改,那么同时意味着 Content-MD5 也可从新计算而后被篡改。因此处在接收阶段的客户端是没法意识到报文主体以及首部字段 Content-MD5 是已经被篡改过的。

7.Content-Range

clipboard.png

  • 针对范围请求,返回响应时使用的首部字段 Content-Range,能告知客户端做为响应返回的实体的哪一个部分符合范围请求。字段值以字节为单位,表示当前发送部分及整个实体大小。

8.Content-Type

clipboard.png

  • 首部字段 Content-Type 说明了实体主体内对象的媒体类型。和首部字 段 Accept 同样,字段值用 type/subtype 形式赋值。 参数 charset 使用 iso-8859-1 或 euc-jp 等字符集进行赋值。

9.Expires

clipboard.png

  • 首部字段 Expires 会将资源失效的日期告知客户端。缓存服务器在接收到含有首部字段 Expires 的响应后,会以缓存来应答请求,在 Expires 字段值指定的时间以前,响应的副本会一直被保存。当超过指定的时间后,缓存服务器在请求发送过来时,会转向源服务器请求 资源。源服务器不但愿缓存服务器对资源缓存时,最好在 Expires 字段内写入与首部字段 Date 相同的时间值。可是,当首部字段 Cache-Control 有指定 max-age 指令时,比起首部字段 Expires,会优先处理 max-age 指令。

10.Last-Modified

clipboard.png

clipboard.png

  • 首部字段 Last-Modified 指明资源最终修改的时间。通常来讲,这个值就是 Request-URI 指定资源被修改的时间。但相似使用 CGI 脚本进行动态数据处理时,该值有可能会变成数据最终修改时的时间。

七.为 Cookie 服务的首部字段

  • 管理服务器与客户端之间状态的 Cookie,虽然没有被编入标准化 HTTP/1.1 的 RFC2616 中,但在 Web 网站方面获得了普遍的应用。 Cookie 的工做机制是用户识别及状态管理。Web 网站为了管理用户的状态会经过 Web 浏览器,把一些数据临时写入用户的计算机内。接着当用户访问该Web网站时,可经过通讯方式取回以前发放的 Cookie。 调用 Cookie 时,因为可校验 Cookie 的有效期,以及发送方的域、路径、协议等信息,因此正规发布的 Cookie 内的数据不会因来自其余 Web 站点和攻击者的攻击而泄露。
  • 至 2013 年 5 月,Cookie 的规格标准文档有如下 4 种。

RFC2109
某企业尝试以独立技术对 Cookie 规格进行标准化统筹。本来的意图是想和网景公司制定的标准交互应用,惋惜发生了微妙的差别。如今该标准已淡出了人们的视线。
RFC2965
为终结 Internet Explorer 浏览器与 Netscape Navigator 的标准差别而致使的浏览器战争,RFC2965 内定义了新的 HTTP 首部 Set-Cookie2 和 Cookie2。可事实上,它们几乎没怎么投入使用。
RFC6265
将网景公司制定的标准做为业界事实标准(De facto standard),从新定义 Cookie 标准后的产物。 目前使用最普遍的 Cookie 标准却不是 RFC 中定义的任何一个。而是在网景公司制定的标准上进行扩展后的产物。

  • 下面的表格内列举了与 Cookie 有关的首部字段。

clipboard.png

1.Set-Cookie

clipboard.png

  • 当服务器准备开始管理客户端的状态时,会事先告知各类信息。下面的表格列举了 Set-Cookie 的字段值。
  • 表 6-9:Set-Cookie 字段的属性

clipboard.png

expires 属性
Cookie 的 expires 属性指定浏览器可发送 Cookie 的有效期。当省略 expires 属性时,其有效期仅限于维持浏览器会话(Session) 时间段内。这一般限于浏览器应用程序被关闭以前。另外,一旦Cookie从服务器端发送至客户端,服务器端就不存在能够显式删除Cookie 的方法。但可经过覆盖已过时的Cookie,实现对 客户端 Cookie 的实质性删除操做。
path 属性
Cookie 的 path 属性可用于限制指定 Cookie 的发送范围的文件目录。不过另有办法可避开这项限制,看来对其做为安全机制的效果不能抱有期待。
domain 属性
经过 Cookie 的 domain 属性指定的域名可作到与结尾匹配一致。好比,当指定 example.com 后,除 example.com 之外,www.example.com 或 www2.example.com 等均可以发送 Cookie。所以,除了针对具体指定的多个域名发送 Cookie 以外,不指定 domain 属性显得更安全。
secure 属性
Cookie 的 secure 属性用于限制 Web 页面仅在 HTTPS 安全链接时,才能够发送 Cookie。

  • 发送 Cookie 时,指定 secure 属性的方法以下所示。

clipboard.png

以上例子仅当在 https://www.example.com/(HTTPS)安全链接的状况下才会进行 Cookie 的回收。也就是说,即便域名相同, http://www.example.com/(HTTP)也不会发生 Cookie 回收行为。 当省略 secure 属性时,不论 HTTP 仍是 HTTPS,都会对 Cookie 进行回收。
HttpOnly 属性
Cookie 的 HttpOnly 属性是 Cookie 的扩展功能,它使 JavaScript 脚本 没法得到 Cookie。其主要目的为防止跨站脚本攻击(Cross-site scripting,XSS)对 Cookie 的信息窃取。 发送指定 HttpOnly 属性的 Cookie 的方法以下所示。

clipboard.png

  • 经过上述设置,一般从 Web 页面内还能够对 Cookie 进行读取操做。 但使用 JavaScript 的 document.cookie 就没法读取附加 HttpOnly 属性后 的 Cookie 的内容了。所以,也就没法在 XSS 中利用 JavaScript 劫持 Cookie 了。 虽然是独立的扩展功能,但 Internet Explorer 6 SP1 以上版本等当下的主流浏览器都已经支持该扩展了。另外顺带一提,该扩展并不是是为了防止 XSS 而开发的。

2.Cookie

clipboard.png

  • 首部字段 Cookie 会告知服务器,当客户端想得到 HTTP 状态管理支持时,就会在请求中包含从服务器接收到的 Cookie。接收到多个 Cookie 时,一样能够以多个 Cookie 形式发送。

八.其余首部字段

  • HTTP 首部字段是能够自行扩展的。因此在 Web 服务器和浏览器的应用上,会出现各类非标准的首部字段。
  • 接下来,咱们就一些最为经常使用的首部字段进行说明。

X-Frame-Options
X-XSS-Protection
DNT
P3P

1.X-Frame-Options

clipboard.png

  • 首部字段 X-Frame-Options 属于 HTTP 响应首部,用于控制网站内容在其余 Web 网站的 Frame 标签内的显示问题。其主要目的是为了防止点击劫持(clickjacking)攻击。 首部字段 X-Frame-Options 有如下两个可指定的字段值。

DENY :拒绝
SAMEORIGIN :仅同源域名下的页面(Top-level-browsingcontext)匹配时许可。(好比,当指定 http://hackr.jp/sample.html 页面为 SAMEORIGIN 时,那么 hackr.jp 上全部页面的 frame 都被容许可加载该页面,而 example.com 等其余域名的页面就不行了)

  • 支持该首部字段的浏览器有:Internet Explorer 八、Firefox 3.6.9+、 Chrome 4.1.249.1042+、Safari 4+ 和 Opera 10.50+ 等。如今主流的浏览器都已经支持。

能在全部的 Web 服务器端预先设定好 X-Frame-Options 字段值是最理想的状态。

  • 对 apache2.conf 的配置实例:

<IfModule mod_headers.c>
Header append X-FRAME-OPTIONS "SAMEORIGIN"
</IfModule>

2.X-XSS-Protection

  • X-XSS-Protection: 1
  • 首部字段 X-XSS-Protection 属于 HTTP 响应首部,它是针对跨站脚本攻击(XSS)的一种对策,用于控制浏览器 XSS 防御机制的开关。首部字段 X-XSS-Protection 可指定的字段值以下。

0 :将 XSS 过滤设置成无效状态
1 :将 XSS 过滤设置成有效状态

3.DNT

clipboard.png

  • 首部字段 DNT 属于 HTTP 请求首部,其中 DNT 是 Do Not Track 的简 称,意为拒绝我的信息被收集,是表示拒绝被精准广告追踪的一种方法。
  • 首部字段 DNT 可指定的字段值以下。

0 :赞成被追踪
1 :拒绝被追踪
因为首部字段 DNT 的功能具有有效性,因此 Web 服务器须要对 DNT 作对应的支持。

4.P3P

clipboard.png

  • 首部字段 P3P 属于 HTTP 相应首部,经过利用 P3P(The Platform for Privacy Preferences,在线隐私偏好平台)技术,可让 Web 网站上 的我的隐私变成一种仅供程序可理解的形式,以达到保护用户隐私的目的。要进行 P3P 的设定,需按如下操做步骤进行。

步骤 1:建立 P3P 隐私
步骤 2:建立 P3P 隐私对照文件后,保存命名在 /w3c/p3p.xml
步骤 3:从 P3P 隐私中新建 Compact policies 后,输出到 HTTP 响应 中

  • 有关 P3P 的详细规范标准请参看下方连接。

The Platform for Privacy Preferences 1.0(P3P1.0)Specification http://www.w3.org/TR/P3P/

协议中对 X- 前缀的废除 在 HTTP 等多种协议中,经过给非标准参数加上前缀 X-,来区别。 于标准参数,并使那些非标准的参数做为扩展变成可能。可是这种简单粗暴的作法有百害而无一益,所以在“RFC 6648 - Deprecating the "X-" Prefix and Similar Constructs in Application Protocols”中提议中止该作法。
然而,对已经在使用中的 X- 前缀来讲,不该该要求其变动。

如下是往日学习总结,有须要的盆友能够去看看噢~~
TCP/IP基础总结性学习(1):了解web和网络基础
https://segmentfault.com/a/11...
TCP/IP基础总结性学习(2):简单的HTTP协议
https://segmentfault.com/a/11...
TCP/IP基础总结性学习(3):HTTP 报文内的 HTTP 信息
https://segmentfault.com/a/11...
TCP/IP基础总结性学习(4):返回结果的 HTTP 状态码
https://segmentfault.com/a/11...
TCP/IP基础总结性学习(5):与 HTTP 协做的 Web 服务器
https://segmentfault.com/a/11...

相关文章
相关标签/搜索