超文本传输协议(HyperText Transfer Protocol,Http)是从服务器传输数据到客户端的传输协议。html
HTTP协议的主要特色可归纳以下:
1.支持客户/服务器模式。
2.简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法经常使用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不一样。因为HTTP协议简单,使得HTTP服务器的程序规模小,于是通讯速度很快。
3.灵活:HTTP容许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
4.无链接:无链接的含义是限制每次链接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开链接。采用这种方式能够节省传输时间。
5.无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺乏状态意味着若是后续处理须要前面的信息,则它必须重传,这样可能致使每次链接传送的数据量增大。另外一方面,在服务器不须要先前信息时它的应答就较快。git
客户端和服务器端交互过程:github
一、客户发起链接;数据库
二、客户发送请求;浏览器
三、服务器响应请求;服务器
四、服务器关闭链接。session
请求消息结构并发
一个请求消息是由请求行、请求头字段、一个空行和消息主体构成。如:测试
GET /hello.htm HTTP/1.1
User-Agent: Mozilla/4.0 (compatible; MSIE5.01; Windows NT)
Host: example.com
Accept-Language: en-us
Accept-Encoding: gzip, deflate
请求行ui
请求消息的第一行就是请求行。它指明使用的请求方法、资源标识符和HTTP版本,如:
请求方法
请求方法用来定义操做资源的方式,HTTP/1.1协议中定义了八种请求方法:
- GET:读取资源数据
- POST:新建资源数据
- PUT:更新资源数据
- DELETE:删除资源数据
- HEAD:读取资源的元数据
- OPTIONS:读取该资源所支持的全部请求方法
- TRACE:回显服务器收到的请求,主要用于测试或诊断
- CONNECT:HTTP/1.1协议中预留给可以将链接改成管道方式的代理服务器。一般用于SSL加密服务器的连接(经由非加密的HTTP代理服务器)
此外,除上述方法,特定的HTTP服务器还能扩展自定义方法。
资源标识符
URI、URL和URN用来识别、定位和命名互联网上的资源。
URI:Uniform Resource Identifier,统一资源标识符
URL:Uniform Resource Locator,统一资源定位符
URN:Uniform Resource Name,统一资源名称
URL和URN都属于URI。
请求头字段
用来传递客户端的更多信息,以及传递解析信息消息主体的必要信息,如:
User-Agent: Mozilla/4.0 (compatible; MSIE5.01; Windows NT)
Host: example.com
Accept-Language: en-us
Accept-Encoding: gzip, deflate
常见请求头字段有:
- Accpt客户端接收哪些Mine类型。如Accept:text/html
- Accept-Encoding:支持的编码类型。如gzip,deflate, sdch
- Accept-Language:可接受的语言。如en-us,en;q=0.8
- User-Ahent:一个标识客户端的字符串。如User-Agent:Mozilla/4.0(compatible;MSIE6.0;Windows NT 5.0) (CRLF)
- Cookie:Cookie。如sessionid=...;theme=4
- Referer:从哪一个页面到该页面
空行
指示头字段区完成,消息主题开始(若是有消息主体的话)。
消息主体
消息主体时请求消息的承载数据。好比在提交POST表单,而且表单方法不是GET时,表单数据就是打包在消息主体内的。消息主题是可选的。
响应消息结构
响应消息由一个状态行、响应头字段、一个空行、消息主体构成。如:
HTTP/1.1 200 OK
Date:Mon,27 Jul 2009 12:22:12 GMT
Server:Apache/2.2.14(Win32)
Last-Modified: Wed, 22 Jul 2009 19:15:34 GMT
Content-Length: 88
Content-Type:text/html
Connection:Closed
<html>
<body>
<h1>Hello, World</h1>
</body>
</html>
状态行
由http版本、状态码、状态描述文字构成。如:
HTTP/1.1 200 OK
状态码
HTTP状态码是以表示网页服务器http响应状态的3位数字代码。
全部的装代码的第一个数字表明了响应的五种状态之一:
- 1xx:表明请求已被接受,须要继续处理。这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束。
- 2xx:表明请求接收、理解而且接收。
- 3xx:表明须要客户端采起进一步的操做才能完成请求。一般,这些状态码用来重定向,后续的请求地址(重定向目标)在本次响应的Location域中指明。当且仅当后续的请求所使用的方法是GET或者HEAD时,用户浏览器才能够在没有用户介入的状况下自动提交所需的后续请求。
- 4xx:表明了客户端看起来可能发生了错误,妨碍了服务器的处理。除非响应的是一个HEAD请求,不然服务器就应该返回一个解释当前错误情况的实体,以及这是临时的仍是永久性的情况。
- 5xx:表明了服务器在处理请求的过程当中有错误或者异常状态发生,也有多是服务器意识到以当前的软硬件资源没法完成对请求的处理。
常见状态码有:
100 Continue 初始的请求已经接受,客户应当继续发送请求的其他部分
101 Switching Protocols 服务器将听从客户的请求转换到另一种协议
200 OK 一切正常,对GET和POST请求的应答文档跟在后面
201 Created 服务器已经建立了文档,Location头给出了它的URL。
202 Accepted 已经接受请求,但处理还没有完成。
203 Non-Authoritative Information 文档已经正常地返回,但一些应答头可能不正确,由于使用的是文档的拷贝
204 No Content 没有新文档,浏览器应该继续显示原来的文档。若是用户按期地刷新页面,而Servlet能够肯定用户文档足够新,这个状态代码是颇有用的
205 Reset Content 没有新的内容,但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容
206 Partial Content 客户发送了一个带有Range头的GET请求,服务器完成了它
300 Multiple Choices 客户请求的文档能够在多个位置找到,这些位置已经在返回的文档内列出。若是服务器要提出优先选择,则应该在Location应答头指明。
301 Moved Permanently 客户请求的文档在其余地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。
302 Found 相似于301,但新的URL应该被视为临时性的替代,而不是永久性的。
303 See Other 相似于301/302,不一样之处在于,若是原来的请求是POST,Location头指定的重定向目标文档应该经过GET提取
304 Not Modified 客户端有缓冲的文档并发出了一个条件性的请求(通常是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还能够继续使用。
305 Use Proxy 客户请求的文档应该经过Location头所指明的代理服务器提取
307 Temporary Redirect 和302(Found)相同。许多浏览器会错误地响应302应答进行重定向,即便原来的请求是 POST,即便它实际上只能在POST请求的应答是303时才能重定向。因为这个缘由,HTTP 1.1新增了307,以便更加清除地区分几个状态代码: 当出现303应答时,浏览器能够跟随重定向的GET和POST请求;若是是307应答,则浏览器只能跟随对GET请求的重定向。
400 Bad Request 请求出现语法错误。
401 Unauthorized 客户试图未经受权访问受密码保护的页面。应答中会包含一个WWW-Authenticate头,浏览器据此显示用户名字/密码对话框,而后在填写合适的Authorization头后再次发出请求。
403 Forbidden 资源不可用。
404 Not Found 没法找到指定位置的资源
405 Method Not Allowed 请求方法(GET、POST、HEAD、Delete、PUT、TRACE等)对指定的资源不适用。
406 Not Acceptable 指定的资源已经找到,但它的MIME类型和客户在Accpet头中所指定的不兼容
407 Proxy Authentication Required 相似于401,表示客户必须先通过代理服务器的受权。
408 Request Timeout 在服务器许可的等待时间内,客户一直没有发出任何请求。客户能够在之后重复同一请求。
409 Conflict 一般和PUT请求有关。因为请求和资源的当前状态相冲突,所以请求不能成功。
410 Gone 所请求的文档已经再也不可用,并且服务器不知道应该重定向到哪个地址。它和404的不一样在于,返回407表示文档永久地离开了指定的位置,而404表示因为未知的缘由文档不可用。
411 Length Required 服务器不能处理请求,除非客户发送一个Content-Length头。
412 Precondition Failed 请求头中指定的一些前提条件失败
413 Request Entity Too Large 目标文档的大小超过服务器当前愿意处理的大小。若是服务器认为本身可以稍后再处理该请求,则应该提供一个Retry-After头
414 Request URI Too Long URI太长
416 Requested Range Not Satisfiable 服务器不能知足客户在请求中指定的Range头
500 Internal Server Error 服务器遇到了意料不到的状况,不能完成客户的请求
501 Not Implemented 服务器不支持实现请求所须要的功能。例如,客户发出了一个服务器不支持的PUT请求
502 Bad Gateway 服务器做为网关或者代理时,为了完成请求访问下一个服务器,但该服务器返回了非法的应答
503 Service Unavailable 服务器因为维护或者负载太重未能应答。例如,Servlet可能在数据库链接池已满的状况下返回503。服务器返回503时能够提供一个Retry-After头
504 Gateway Timeout 由做为代理或网关的服务器使用,表示不能及时地从远程服务器得到应答
505 HTTP Version Not Supported 服务器不支持请求中所指明的HTTP版本
响应头字段
和请求消息相似,首部字段会包括服务器自己的一些信息指示、以及响应消息自己的元数据。如:
Date:Mon,27 Jul 2009 12:22:12 GMT
Server:Apache/2.2.14(Win32)
Last-Modified: Wed, 22 Jul 2009 19:15:34 GMT
Content-Length: 88
Content-Type:text/html
Connection:Closed
常见响应头有:
- Content-Encoding:数据的编码类型。如:Content-Encoding:gzip
- Server:服务器的名称。如Server:thin 1.5.0 codename Knife
- Location:通知客户端新的资源位置。如:L哦擦条呢:http://www.github.com/login
- Content-Type:响应数据的类型。如:Content-type:text/html;charset=UTF-8
- Content-Encoding:响应数据的编码格式。如:gzip。客户端会根据该值对响应内容解码。
消息主体
消息主体时响应消息的承载数据。