超文本传输协议(Hypertext Transfer Protocol,简称HTTP)是应用层协议。HTTP 是一种请求/响应式的协议,即一个客户端与服务器创建链接后,向服务器发送一个请求;服务器接到请求后,给予相应的响应信息。html
HTTP 请求报文nginx
HTTP 请求报文由请求行、请求头部、空行 和 请求包体 4 个部分组成,以下图所示:web
下面对请求报文格式进行简单的分析:浏览器
请求行:请求行由方法字段、URL 字段 和HTTP 协议版本字段 3 个部分组成,他们之间使用空格隔开。经常使用的 HTTP 请求方法有 GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT;缓存
● GET:当客户端要从服务器中读取某个资源时,使用GET 方法。GET 方法要求服务器将URL 定位的资源放在响应报文的数据部分,回送给客户端,即向服务器请求某个资源。使用GET 方法时,请求参数和对应的值附加在 URL 后面,利用一个问号(“?”)表明URL 的结尾与请求参数的开始,传递参数长度受限制。例如,/index.jsp?id=100&op=bind。服务器
● POST:当客户端给服务器提供信息较多时可使用POST 方法,POST 方法向服务器提交数据,好比完成表单数据的提交,将数据提交给服务器处理。GET 通常用于获取/查询资源信息,POST 会附带用户数据,通常用于更新资源信息。POST 方法将请求参数封装在HTTP 请求数据中,以名称/值的形式出现,能够传输大量数据;网络
请求头部:请求头部由关键字/值对组成,每行一对,关键字和值用英文冒号“:”分隔。请求头部通知服务器有关于客户端请求的信息,典型的请求头有:并发
空行:最后一个请求头以后是一个空行,发送回车符和换行符,通知服务器如下再也不有请求头;app
请求包体:请求包体不在 GET 方法中使用,而是在POST 方法中使用。POST 方法适用于须要客户填写表单的场合。与请求包体相关的最常使用的是包体类型 Content-Type 和包体长度 Content-Length;less
HTTP 响应报文
HTTP 响应报文由状态行、响应头部、空行 和 响应包体 4 个部分组成,以下图所示:
下面对响应报文格式进行简单的分析:
状态行:状态行由 HTTP 协议版本字段、状态码和状态码的描述文本 3 个部分组成,他们之间使用空格隔开;
响应头部:响应头可能包括:
Location:Location响应报头域用于重定向接受者到一个新的位置。例如:客户端所请求的页面已不存在原先的位置,为了让客户端重定向到这个页面新的位置,服务器端能够发回Location响应报头后使用重定向语句,让客户端去访问新的域名所对应的服务器上的资源;
Server:Server 响应报头域包含了服务器用来处理请求的软件信息及其版本。它和 User-Agent 请求报头域是相对应的,前者发送服务器端软件的信息,后者发送客户端软件(浏览器)和操做系统的信息。
Vary:指示不可缓存的请求头列表;
Connection:链接方式;
对于请求来讲:close(告诉 WEB 服务器或者代理服务器,在完成本次请求的响应后,断开链接,不等待本次链接的后续请求了)。keepalive(告诉WEB服务器或者代理服务器,在完成本次请求的响应后,保持链接,等待本次链接的后续请求);
对于响应来讲:close(链接已经关闭); keepalive(链接保持着,在等待本次链接的后续请求); Keep-Alive:若是浏览器请求保持链接,则该头部代表但愿WEB 服务器保持链接多长时间(秒);例如:Keep-Alive:300;
WWW-Authenticate:WWW-Authenticate响应报头域必须被包含在401 (未受权的)响应消息中,这个报头域和前面讲到的Authorization 请求报头域是相关的,当客户端收到 401 响应消息,就要决定是否请求服务器对其进行验证。若是要求服务器对其进行验证,就能够发送一个包含了Authorization 报头域的请求;
`空行:最后一个响应头部以后是一个空行,发送回车符和换行符,通知服务器如下再也不有响应头部。
响应包体:服务器返回给客户端的文本信息;
HTTP 工做原理
HTTP 协议采用请求/响应模型。客户端向服务器发送一个请求报文,服务器以一个状态做为响应。
如下是 HTTP 请求/响应的步骤:
HTTP 无状态性
HTTP 协议是无状态的(stateless)。也就是说,同一个客户端第二次访问同一个服务器上的页面时,服务器没法知道这个客户端曾经访问过,服务器也没法分辨不一样的客户端。HTTP 的无状态特性简化了服务器的设计,使服务器更容易支持大量并发的HTTP 请求。
HTTP 持久链接
HTTP1.0 使用的是非持久链接,主要缺点是客户端必须为每个待请求的对象创建并维护一个新的链接,即每请求一个文档就要有两倍RTT 的开销。由于同一个页面可能存在多个对象,因此非持久链接可能使一个页面的下载变得十分缓慢,并且这种短链接增长了网络传输的负担。HTTP1.1 使用持久链接keepalive,所谓持久链接,就是服务器在发送响应后仍然在一段时间内保持这条链接,容许在同一个链接中存在屡次数据请求和响应,即在持久链接状况下,服务器在发送完响应后并不关闭TCP 链接,而客户端能够经过这个链接继续请求其余对象。
HTTP/1.1 协议的持久链接有两种方式:
● 非流水线方式:客户在收到前一个响应后才能发出下一个请求;
● 流水线方式:客户在收到 HTTP 的响应报文以前就能接着发送新的请求报文;
最后给出一个具体例子:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
Remote Address:116.57.254.104:80
Request URL:http:
//hr.tencent.com/
Request Method:GET
Status Code:200 OK
Request Headers
GET / HTTP/1.1
Host: hr.tencent.com
Connection: keep-alive
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
User-Agent: Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.114 Safari/537.36
Accept-Encoding: gzip,deflate,sdch
Accept-Language: en-US,en;q=0.8,zh-CN;q=0.6,zh;q=0.4
Cookie: pgv_pvi=2098703360; PHPSESSID=bc7onl0dojbsatscsfv79pds77; pgv_info=ssid=s1454606128;
pgv_pvid=926725350; ts_uid=4084753309
Response Header
HTTP/1.1 200 OK
Server: nginx
Date: Mon, 26 Jan 2015 01:09:10 GMT
Content-Type: text/html;charset=utf-8
Content-Length: 3631
Connection: keep-alive
X-Powered-By: PHP/5.3.10
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Vary: Accept-Encoding
Content-Encoding: gzip
|
从请求报文能够知道:
1
|
GET / HTTP/1.1
|
请求方法 GET 表示一个读取请求,将从服务器得到网页数据,/表示URL 的路径,URL 老是以/开头,/就表示首页,最后的HTTP/1.1 指示采用的 HTTP 协议版本是 1.1;请求域名以下所示:
1
|
Host: hr.tencent.com
|
响应报文以下:
1
|
HTTP/1.1 200 OK Server: nginx
|
原文来自:http://network.51cto.com/art/201501/464513_1.htm