图解HTTP第六章：HTTP首部

时间 2019-11-12

标签图解 http 第六首部栏目 HTTP/TCP 繁體版

原文原文链接

学习HTTP首部的结构和首部中各字段的用法。html

HTTP首部字段

使用首部字段是为了给浏览器和server提供报文主体大小、所使用的语言、认证信息等内容。web

首部字段相应单个HTTP首部可以有多个值。假设首部字段反复，依据浏览器逻辑处理。有的以第一个为准，有的以最后出现的为准。算法
4种首部字段类型浏览器
- 通用首部字段(General Header Fields)
- 请求首部字段(Request Header Fields)
- 响应首部字段(Response Header Fields)
- 实体首部字段(Entity Header Fields)：针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新时间与实体有关的信息。
首部字段一览
在HTTP通讯过程当中。不限于下面规范中的字段，还有Cookie、Set-Cookie、Content-Disposition等字段。缓存

End-to-end首部和Hop-by-hop首部

HTTP首部字段依据缓存代理和非缓存代理的行为，分红2种类型（也可以依据类型分为通用、请求、响应、实体首部字段）：安全

端到端首部(End-to-end Header)
此类别中的首部会转发给请求/响应相应的终于接收目标，且必须保存在由缓存生成的响应中，它必须被转发。markdown
逐跳首部(Hop-by-hop Header)
此类别中的首部仅仅对单次转发有效。会因经过缓存或代理而再也不转发。必需要提供Connnection字段才干使用hop-by-hop首部。cookie
它们有(除了这些全是端到端首部)：
Connection、Keep-Alive、Proxy-Authenticate、Proxy-Authorization、Trailer、TE、Transfer-Encoding、Upgradedom

通用首部字段：

Cache-Control：经过该命令，就能操做缓存的工做机制；參数是多选的，经过,分隔。ide
- 表示可否缓存的指令：
  Cache-Control：public，代表其余用户也可以利用缓存
  Cache-Control：private。仅仅让特定用户缓存，缓存server会对该特定用户提供资源缓存的服务。
- no-cache指令：
  请求使用时，则表示client将不会接收缓存过的响应。因而缓存server必须转发给源server。
  响应使用时，则表示缓存server不能缓存资源，源server也不正确缓存server请求中提出的资源有效性进行确认，且禁止其对响应资源进行缓存操做。
- 控制可运行缓存对象的指令no-store
  no-store指令暗示请求(和相应的响应)中包括机密信息。所以规定缓存不能在本地存储请求或响应的任一部分。
- 指定缓存期限和认证的指令
- max-age=60(秒)：
  请求使用时，则断定缓存资源的缓存时间，小就获取缓存，大则缓存server转发给源server。
  
  响应使用时，缓存server将不正确资源的有效性再做确认。该时间表示资源有效时间。
- s-maxage=60(秒)：功能和max-age指令一样。但s-maxage仅仅适用于供多位用户使用的公共缓存server。即对同一用户反复返回响应的server不起做用。使用s-maxage后，Expires和max-age会被忽略。
- min-refresh=60(秒)：要求缓存server返回至少还未过指定时间的缓存资源。
- max-stale=60(秒)：表示缓存资源即便过时，但仍处于该指令指定时间内，仍旧会被client接收。
  如未指定详细数值，则缓存资源一直有效。
- only-if-cached：要求缓存server不又一次载入响应。也不确认资源的有效性，直接返回。若缓存server无该缓存，则返回504。
- must-revalidate：代理会向源server再次验证即将返回的响应缓存眼下是否仍然有效。若代理没法链接到源server的话。则返回504。使用must-revalidate时会忽略max-stale指令。
  
  假设缓存过了新奇期，则必须又一次验证.而不是试图返回一个不在新奇期的缓存.与no-cache的差异在于,no-cache,全然无视新奇期的概念.老是强制又一次验证.理论上,must-revalidate更节省流量,但相比no-cache,可能并不老是那么精准.因为即便缓存者。以为是新奇的,也不能保证server端没有作过更新.假设缓存者是一个缓存代理server,假设其试图又一次验证时，没法链接上原始server,则也不一样意返回一个不新奇的,缓存中的副本.而是必须返回一个504 Gateway timeout.
- proxy-revalidate：限制上与must-revalidate类似.差异在于受体的范围.proxy-revalidate,是要排除掉用户代理(浏览器)的缓存的.即，其规则并不该用于用户代理的本地缓存上.
- no-transform：无论请求仍是响应中，缓存都不能改变实体主体的媒体类型。可以防止缓存或代理压缩图片等操做。
- cache-extension：经过该指令标记，可以扩展Cache-Control首部字段内的指令。
Connection：
两个做用：
- 控制再也不转发给代理的首部字段
  client发送请求和server返回的响应内。使用Connection首部字段可控制再也不转发给代理的首部字段(Hop-by-hop首部)。
- 管理持久链接
  Connection:close、Connection:Keep-Alive表示服务端想断开链接或保持持久链接。
Date：代表HTTP报文的日期和时间
Pragma：Progma:no-cache遗留字段，仅仅在client发送的请求中，要求缓存server不返回缓存的资源。
Trailer：说明在报文主体后记录了哪些首部字段。可应用在分块传输编码时。
Transfer-Encoding：规定了传输报文主体时採用的编码方式。仅对分块传输编码有效。
Upgrade：在使用该字段时。需额外指定Connection：Upgrade，用于检測是否可以使用更高的版本号进行通讯。可以指定一个全然不一样的通讯协议。
Via：追踪client和server之间的请求和响应报文的传输路径，可以避免请求回环的发送。报文通过代理或网关时，会先在首部字段Via中附加该server的信息。而后转发。
Warning：告知用户一些与缓存相关的问题的警告。

请求首部字段

Accept：可通知server，用户代理可以处理的媒体类型及媒体类型的相对优先级。
可用用type/subtype这样的形式。一次指定多种媒体类型。
Accept-Charset：通知server用户代理支持的字符集及字符集的相对优先顺序。可一次指定多种字符集。
Accept-Encoding：告知server用户代理支持的内容编码及内容编码的优先级顺序。
可一次指定多种内容编码。
gzip、compress、deflate、identity。
Accept-Language：告知server用户代理可以处理的天然语言集，以及优先级。可一次指定多种。
Authorization：
Expect：告知server，指望出现的某种特定行为。因server没法理解client的指望做出回应而错误发生时，会返回417 Expectation Failed。
From：告知server用时用户代理的用户的电子邮件地址。
Host：虚拟主机运行在同一个IP上，使用Host区分。必须被包括在请求内的首部字段。
形如If-xxx这样的请求首部。均可成为条件请求。
server接收到附带条件的请求后，仅仅有推断指定条件为真时。才会运行请求。
- If-Match：它会告知server匹配资源所用的实体标记(ETag)值，这时的server没法使用弱ETag值。server会对照If-Match的字段值和资源的ETag值。仅当二者一致时，才会运行请求。反之，返回412 Precondition Failed。可以使用*指定If-Match值。server会忽略ETag值，仅仅要资源存在就处理请求。
- If-None-Match：和If-Match做用相反。
  仅仅有在If-None-Match值与ETag值不一致时，可处理该请求。
- If-Modified-Since：server在If-Modified-Since值后资源更新过，则处理该请求。假设没有更新过，则返回304 Not Modified。用于确认代理或client拥有的本地资源的有效性。
- If-Range：告知server指定的If-Range值(ETag值或时间)和请求资源的ETag值或时间相一致时。则做为范围请求处理。反之，则返回全体资源。
  通常和Range请求头连用。
- If-Unmodified-Since：和If-Modified-Since相反。指定的请求资源仅仅有在字段值内指定的日期时间以后。未发生更新的状况下，才干处理请求。反之返回412 Precondition Failed。
Max-Forwards：经过Trace或OPTIONS方法，发送包括首部字段Max-Forwards请求时，十进制整数。每转发一次，值减一，为0值。则再也不转发，直接返回响应。
Proxy-Authorization：接收到从代理server发来的认证质询时，client会使用该首部，以告知server认证所需要的信息。
Range：获取部分资源的范围请求。
成功处理时，返回206 Partial Content响应；没法处理时，返回200 OK。
Referer：会告知server请求的原始资源的URI。
TE：告知serverclient可以处理的传输编码方式及相对优先级。和Accept-Encoding功能很是像，但用于传输编码。
还可以指定伴随trailer字段的分块传输编码方式。仅仅需要TE:trailers来指明。
User-Agent：会将建立请求的浏览器和用户代理名称等信息传达给server。

响应首部字段

Accept-Ranges：用来告知clientserver可否处理范围请求。以指定获取server某个部分的资源。两个值：Accept-Ranges：bytes和Accept-Ranges：none。
Age：单位是秒。指源server多久前建立了响应；假设是缓存server时，表示缓存后的响应再次发起认证到认证完毕的时间值。代理建立的响应必须加上Age。
ETag：ETag能告知client实体标识。它是一种可将资源以字符串形式作惟一性标识的方式。server会为每份资源分配相应的ETag值。
强ETag值：实体发生的细微变化都会改变其值
弱ETag值：仅仅用于提示资源是否一样。仅仅有发生根本性改变。ETag值才会变化，会在字段值開始处附加W/。
Location：将响应接收方引导至某个与请求URI位置不一样的资源。
基本上它会和3xx : Redirection重定向一块使用。差点儿所有浏览器在接收到Location响应后，都会强制性的尝试对已提示的重定向资源的訪问。
Proxy-Authenticate：把由代理server所要求的认证信息发送给client。
Retry-After：告知client应该在多久以后再次发送请求，主要配合503 Service Unavalible或3xx Redirection一块儿使用。字段值可以指定详细日期时间、或建立响应后的秒数。
Server：告知client当前server上安装的HTTPserver应用程序的信息。包括软件应用名称、可能还有版本号号和安装时启用的可选项。
Vary：该首部可以对缓存进行控制。源server会向代理server传达关于本地缓存用法的命令。
从代理server接收到源server返回包括Vary指定项的响应以后，再次接收到请求时，仅返回一样Vary首部的缓存；其余则必需要从源server又一次获取。
WWW-Authenticate：用于HTTP訪问认证。会告知client适用于訪问请求URI所指定资源的认证方案和带參数提示的质询。
状态码401 Unauthorized响应中，确定有这个首部字段。

实体首部字段

实体首部字段是在请求报文和响应报文中的实体部分所使用的首部。用于补充内容的更新时间等与实体相关的信息。

实体：做为请求或响应的有效载荷数据被传输，其内容由实体首部和实体主体组成。

Allow：
用于通知client可以可以支持Request-UIR指定资源的所有HTTP方法。当server接收到不支持的HTTP方法时，会返回状态码405 Method Not Allowed，同一时候会把所有能支持的HTTP方法写入首部字段Allow后返回。
Content-Encoding：
告知clientserver对实体的主体部分选用的内容编码方式。
Content-Language：
告知client。实体主体使用的天然语言。
Content-Length：
代表了实体主体部分的大小(字节)。
对实体主体进行内容编码传输时。不能再使用Content-Length首部字段。
Content-Location：
给出与报文主体部分相相应的URI，表示返回的资源相应的URI。
Content-MD5：
是一串由MD5算法生成的值，其目的在于检查报文主体在传输过程当中是否保持完整。以及确认传输到达。
Content-Range：Content-Range：bytes5001-10000/10000
告诉client做为响应返回的实体的哪一个部分符合范围请求。
以字节为单位。表示当前发送部分及整个实体大小。
Content-Type：
说明了实体主体内对象的媒体类型。
Expires：
会将资源失效的日期告知client。
缓存server在接收到含有首部字段Expires的响应后，会以缓存来应答请求，在Expires字段值指定时间以前，缓存一直有效。超过是，会向源server请求资源。
源server不但愿缓存server对资源缓存时。在Expries字段内写入与首部字段Date一样的时间值。
当Cache-Control指定了max-age指令时。会有限处理。
Last-Modified
指明资源终于改动时间。

为Cookie服务的首部字段

Set-Cookie：
- name：必须项。name=xxx
- expires：指定浏览器可发送Cookie的有效期。
- path：可用于限定Cookie的发送范围的文件文件夹。不能保证安全。
- domain：经过该属性指定的域名可作到与结尾匹配一致就能够发送Cookie。
- secure：该属性用于限制Web页面仅在HTTPS安全链接时，才干够发送Cookie。
  Set-Cookie：name=xxx;secure
  HttpOnly：使Js脚本没法得到Cookie，防止XSS(Cross-site scripting)对Cookie的信息窃取。Set-Cookie：name=xxx;HttpOnly
Cookie：告知server，当client想得到HTTP状态管理支持时。就会在请求中包括从server接收到的Cookie。接收到多个Cookie时。可以以多个Cookie形式发送。

參考：
你应该了解的一些web缓存相关的概念.