HTTP简介

HTTP协议(HyperText Transfer Protocol,超文本传输协议)是因特网上应用最为普遍的一种网络传输协议,全部的WWW文件都必须遵照这个标准。浏览器

HTTP是一个基于TCP/IP通讯协议来传递数据(HTML 文件, 图片文件, 查询结果等)。服务器

HTTP 工做原理

HTTP协议工做于客户端-服务端架构上。浏览器做为HTTP客户端经过URL向HTTP服务端即WEB服务器发送全部请求。网络

Web服务器有:Apache服务器,IIS服务器(Internet Information Services)等。架构

Web服务器根据接收到的请求后,向客户端发送响应信息。性能

HTTP默认端口号为80,可是你也能够改成8080或者其余端口。测试

HTTP三点注意事项:网络传输协议

  • HTTP是无链接:无链接的含义是限制每次链接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开链接。采用这种方式能够节省传输时间。
  • HTTP是媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据均可以经过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
  • HTTP是无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺乏状态意味着若是后续处理须要前面的信息,则它必须重传,这样可能致使每次链接传送的数据量增大。另外一方面,在服务器不须要先前信息时它的应答就较快。

如下图表展现了HTTP协议通讯流程:spa

1.2 在TCP/IP协议栈中的位置

HTTP协议一般承载于TCP协议之上,有时也承载于TLS或SSL协议层之上,这个时候,就成了咱们常说的HTTPS。以下图所示:
代理

默认HTTP的端口号为80,HTTPS的端口号为443。code

1.3 HTTP的请求响应模型

HTTP协议永远都是客户端发起请求,服务器回送响应。见下图:

这样就限制了使用HTTP协议,没法实如今客户端没有发起请求的时候,服务器将消息推送给客户端。

HTTP协议是一个无状态的协议,同一个客户端的此次请求和上次请求是没有对应关系。

1.4 工做流程

一次HTTP操做称为一个事务,其工做过程可分为四步:

1)首先客户机与服务器须要创建链接。只要单击某个超级连接,HTTP的工做开始。

2)创建链接后,客户机发送一个请求给服务器,请求方式的格式为:统一资源标识符(URL)、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和可能的内容。

3)服务器接到请求后,给予相应的响应信息,其格式为一个状态行,包括信息的协议版本号、一个成功或错误的代码,后边是MIME信息包括服务器信息、实体信息和可能的内容。

4)客户端接收服务器所返回的信息经过浏览器显示在用户的显示屏上,而后客户机与服务器断开链接。

若是在以上过程当中的某一步出现错误,那么产生错误的信息将返回到客户端,有显示屏输出。对于用户来讲,这些过程是由HTTP本身完成的,用户只要用鼠标点击,等待信息显示就能够了。

 

HTTP 消息结构

HTTP是基于客户端/服务端(C/S)的架构模型,经过一个可靠的连接来交换信息,是一个无状态的请求/响应协议。

一个HTTP"客户端"是一个应用程序(Web浏览器或其余任何客户端),经过链接到服务器达到向服务器发送一个或多个HTTP的请求的目的。

一个HTTP"服务器"一样也是一个应用程序(一般是一个Web服务,如Apache Web服务器或IIS服务器等),经过接收客户端的请求并向客户端发送HTTP响应数据。

HTTP使用统一资源标识符(Uniform Resource Identifiers, URI)来传输数据和创建链接。

一旦创建链接后,数据消息就经过相似Internet邮件所使用的格式[RFC5322]和多用途Internet邮件扩展(MIME)[RFC2045]来传送。

HTTP格式

每一个HTTP链接,它的请求和响应都遵循相同的格式,包含Header和Body两部分,其中Body是可选的。

HTTP GET请求的格式:

GET /path HTTP/1.1
Header1: Value1
Header2: Value2
Header3: Value3

每一个Header一行一个,换行符是\r\n

HTTP POST请求的格式:

POST /path HTTP/1.1
Header1: Value1
Header2: Value2
Header3: Value3

body data goes here...

当遇到连续两个\r\n时,Header部分结束,后面的数据所有是Body。

HTTP响应的格式:

200 OK
Header1: Value1
Header2: Value2
Header3: Value3

body data goes here...

HTTP响应若是包含body,也是经过\r\n\r\n来分隔的。

请再次注意,Body的数据类型由Content-Type头来肯定,若是是网页,Body就是文本,若是是图片,Body就是图片的二进制数据。

当存在Content-Encoding时,Body数据是被压缩的,最多见的压缩方式是gzip,因此,看到Content-Encoding: gzip时,须要将Body数据先解压缩,才能获得真正的数据。压缩的目的在于减小Body的大小,加快网络传输。

 

客户端请求消息 message-request

客户端发送一个HTTP请求到服务器的请求消息包括如下格式:请求行(request line)、请求头部(request header)、空行和请求数据(request body?)四个部分组成,下图给出了请求报文的通常格式。

请求行中的GET称之为请求方式。根据HTTP标准,HTTP请求可使用多种请求方法。

HTTP1.0定义了三种请求方法: GET, POST 和 HEAD方法。

HTTP1.1新增了五种请求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。

序号 方法 描述
1 GET 请求指定的页面信息,并返回实体主体。
2 HEAD 相似于get请求,只不过返回的响应中没有具体的内容,用于获取报头
3 POST 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会致使新的资源的创建和/或已有资源的修改。
4 PUT 从客户端向服务器传送的数据取代指定的文档的内容。
5 DELETE 请求服务器删除指定的页面。
6 CONNECT HTTP/1.1协议中预留给可以将链接改成管道方式的代理服务器。
7 OPTIONS 容许客户端查看服务器的性能。
8 TRACE 回显服务器收到的请求,主要用于测试或诊断。

服务器响应消息 message-response

HTTP响应消息也由四个部分组成,分别是:状态行、消息报头(response header)、空行和响应正文(response body)。

状态行格式: HTTP版本号 状态码 缘由叙述<CRLF>
举例:HTTP/1.1 200 OK
状态码用于表示服务器对请求的处理结果,它是一个三位的十进制数。响应状态码分为5类,以下所示:

相关文章
相关标签/搜索