HTTP相关整理(上)

时间 2019-11-08

标签 http 相关整理栏目 HTTP/TCP 繁體版

原文原文链接

此次整理HTTP相关知识点的初衷是由于项目中有大量与网络请求相关的知识细节点，因此此次整理的更多的是平常中用获得的点(参考图解HTTP)，另外给打算作FE的新人们一些建议:多重视网络这方面的知识。文章的中间我会穿插一些面试时比较容易问到的网络知识点。html

告知服务器意图的HTTP方法

HTTP方法中，咱们最经常使用的是GET,POST,DELETE，下表对HTTP/1.1中可用的方法进行了罗列。面试

GET	获取资源
POST	传输实体主体
PUT	传输文件(通常会配合Web应用程序验证机制或结构设计采用REST(表征状态转移)标准的同类网站)
HEAD	得到报文首部，与GET方法同样，只是不返回报文主体内容。用于确认URI的有效性及资源更新的日期时间等。
DELETE	删除文件，与PUT相反（响应返回204 No Content）
OPTIONS	询问支持的方法，查询针对请求URI指定的资源支持的方法（Allow:GET、POST、HEAD、OPTIONS）。
TRACE	追踪路径
CONNECT	要求用隧道协议链接代理（主要使用SSL（安全套接层）和TLS（传输层安全）协议把通讯内容加密后经网络隧道传输）。

提问:GET与POST的区别？浏览器

能够参考浅谈HTTP中Get与Post的区别。缓存

DNS、HTTP、TCP、IP之间的关系

下图须要补充：在从DNS服务器获取IP后，进行3次握手。安全

提问：为何三次握手，二次不能够吗？服务器

答：不能够，只有完成3次才能进行后续操做，若在握手过程当中某个阶段中断，TCP协议会再次以相同的顺序发送相同的数据包。并且，第三次握手是客户端为了让服务器知道它是否接收到响应，确保链接创建成功。以下所示：cookie

----------SYN-----------> 网络

　　　　　　　　　　客户端　---------SYN/ACK-------> 服务器dom

-----------ACK----------->网站

HTTP状态码

状态码的职责是当客户端向服务器端发送请求时，描述返回的请求结果。状态码以3为数字和缘由短语组成。数字中的第一位定义了响应类别，后两位无分类。响应类别有如下五种：

	类别	缘由短语
1xx	Informational(信息性状态码)	接收的请求正在处理
2xx	Success（成功状态码）	请求正常处理完毕
3xx	Redirection（重定向状态码）	须要进行附加操做以完成请求
4xx	Client Error（客户端错误状态码）	服务器没法处理请求
5xx	Server Error（服务器错误状态码）	服务器处理请求出错

只要遵照状态码类别的定义，即便改变 RFC2616 中定义的状态码，或服务器端自行建立状态码都没问题。

经常使用的14种状态码：

2XX 成功

200 OK：请求被正常处理
204 No Content：通常在只需从客户端往服务器发送信息，而对客户端不须要发送新信息内容的状况下使用。
206 Partial Content：客户端进行范围请求

3XX 重定向

301 Moved Permanently：永久重定向。表示请求的资源已被分配了新的URI，之后应使用资源如今所指的URI。也就是说，若是已经把资源对应的URI保存为书签了，这时应该按Location首部字段提示的URI从新保存。
302 Found：临时性重定向。表示请求的资源已被分配了新的URI，但愿用户（本次）能使用新的URI访问。和301 Moved Permanently状态码类似，但302状态码表明的资源不是被永久移动，只是临时性质的。换句话说，已移动的资源对应的URI未来还有可能发生改变。好比，用户把URI保存成书签，但不会像301状态码出现时那样去更新书签，而是仍旧保留返回302状态码的页面对应的URI。
303 See Other：表示因为请求对应的资源存在着另外一个URI，应使用GET方法定向获取请求的资源。这与302相似，但303明确表示客户端应当采用GET方法获取资源。
304 Not Modified：该状态码表示客户端发送附带条件的请求（指采用GET方法的请求报文中包含If-Match,If-Modified-Since，If-None-March，If-Range，If-Unmodified-Since中任一首部。）时，服务器端容许请求访问资源，但因发生请求为知足条件的状况后，直接返回304（服务器端资源未改变，可直接使用客户端未过时的缓存）。304状态码返回时，不包含任何响应的主体部分。
304虽被划分在3XX类别，可是和重定向没有关系。
307 Temporary Redirect：临时重定向。与302有相同含义。307遵照浏览器标准，不会从POST变成GET。

4XX 客户端错误

400 Bad Request：表示请求报文中存在语法错误。
401 Unauthorized：表示发送的请求须要有经过HTTP认证（BASIC认证、DIGEST认证）的认证信息。
403 Forbidden：代表对请求资源的访问被服务器拒绝了。服务器端可在实体的主体部分对缘由进行描述（可选）
404 Not Found：代表服务器上没法找到请求的资源。除此以外，也能够在服务器端拒绝请求且不想说明理由时时用。

5XX 服务器错误

500 Interval Server Error：代表服务器端在执行请求时发生了错误。也有多是Web应用存在的bug或某些临时的故障。
503 Service Unavailable：代表服务器暂时处于超负载或正在进行停机维护，如今没法处理请求。若是事先得知解除以上情况须要的时间，最好写入Retry-After首部字段再返回给客户端。

提问：301与302区别？

答：301是永久性重定向，搜索引擎在抓取新内容的同时也将旧的网址替换为重定向以后的网址。 302是临时性重定向，搜索引擎会抓取新的内容而保留旧的网址。由于服务器返回302代码，搜索引擎认为新的网址只是暂时的。

HTTP首部

HTTP协议的请求和响应报文中一定包含HTTP首部。使用首部字段是为了给浏览器和服务器提供报文主体大小、所使用的语言、认证信息等内容。

HTTP首部字段根据实际通途被分为如下4种类型：

通用首部字段（General Header Fileds）：请求报文和响应报文两方都会使用的首部
请求首都字段（Request Header Fields）：从客服端向服务器端发送请求报文时使用的首部。补充了请求的附加内容、客户端信息、响应内容相关优先级等信息。
响应首部字段（Response Header Fields）：从服务器端向客户端返回响应报文时使用的首部。补充了响应的附加内容，也会要求客户端附加额外的内容信息。
实体首部字段（Entity Header Fields）：针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新时间等与实体有关的信息。

通用首部字段

首部字段名	说明
Cache-Control	控制缓存行为
Connection	逐跳首部、链接的管理
Date	建立报文的日期时间
Pragma	报文指令
Trailer	报文末端的首部一览
Transfer-Encoding	指定报文主体的传输编码方式
Upgrade	升级为其余协议
Via	代理服务器的相关信息
Warning	错误通知

Cache-Control的no-cache指令表明不缓存过时的资源，而不是不缓存。no-store才是真正不进行缓存。 Connection首部字段的值为close时，表明服务器想明确断开链接（HTTP/1.1默认都是持久链接）

请求首部字段

首部字段名	说明
Accept	用户代理可处理的媒体类型
Accept-Charset	优先的字符集
Accept-Encoding	优先的内容编码
Accept-Language	优先的语言
Authorization	Web认证信息
Expect	期待服务器的行为
From	用户的电子邮箱地址
Host	请求资源所在服务器
If-Match	比较实体标记（ETag）
If-Modified-Since	比较资源的更新时间
If-Node-Match	比较实体标记（与If-Match相反）
If-Range	资源未更新时发送实体Byte的范围请求
If-Unmodified-Since	比较资源的更新时间（与If-Modified-Since相反）
Max-Forwards	最大传输逐跳数
Proxy-Authorization	代理服务器要求客户端的认证信息
Range	实体的字节范围请求
Referer	对请求中URI的原始获取方
TE	传输编码的优先级
User-Agent	HTTP客户端程序的信息

该表的Accept*字段均可以指定权重q（0-1）。当服务器提供多种内容时，将会首先返回权重最高的。 If-xxx请求首部字段都称为条件请求，服务器接收到附带条件的请求后，只有判断指定条件为真时，才回执行请求。 Referer 的正确拼写应该是Referrer。当直接在浏览器的地址栏输入URI时，或处于安全考虑时，可不发该首部字段。

响应首部字段

首部字段名	说明
Accept-Ranges	是否接受字节范围请求
Age	推算资源建立通过时间
ETag	资源的匹配信息
Location	令客户端重定向至指定URI
Proxy-Authenticate	代理服务器对客户端的认证信息
Retry-After	对再次发起请求的时机要求
Server	HTTP服务器的安装信息
Vary	代理服务器缓存的管理信息
WWW-Authenticate	服务器对客户端的认证信息

实体首部字段

首部字段名	说明
Allow	资源可支持的HTTP方法
Content-Encoding	实体主体适用的编码方式
Content-Language	实体主体的天然语言
Content-Length	实体主体的大小（字节）
Content-Location	替代对应资源的URI
Content-MD5	实体主体的报文摘要
Content-Range	实体主体的位置范围
Content-Type	实体主体的媒体类型
Expires	实体主体过时的日期时间
Last-Modified	资源的最后修改日期时间

为Cookie服务的首部字段

首部字段名	说明	首部类型
Set-Cookie	开始状态管理所使用的Cookie信息	响应首部字段
Cookie	服务器接收到的Cookie信息	请求首部字段

Set-Cookie字段的属性

属性	说明
NAME=VALUE	赋予Cookie的名称和其值（必需项）
expires=DATE	Cookie的有效期（若不明确指定则默认为浏览器关闭前为止）
path=Path	将服务器上的文件目录做为Cookie的适用对象（若不指定则默认为文档所在的文件目录）
domain=域名	做为Cookie适用对象的域名（若不指定则默认为建立Cookie的服务器的域名）
Secure	仅在HTTPS安全通讯时才会发送Cookie
HttpOnly	加以限制，使Cookie不能被JavaSript脚本访问

expires：一旦Cookie从服务器端发送至客户端，服务器端就不存在能够显示删除Cookie的方法。但可经过覆盖已过时的Cookie，实现对客户端Cookie的实质性删除操做。 path：用来指定cookie被发送到服务器的哪个目录路径下（即被服务器哪一个路径接收cookie），其中"/"指的是站点根目录，可在同一台服务器（即便有多个应用）内共享该cookie。

后续

下回再对http2.0，身份认证以及Web攻击技术的知识点进行罗列总结。