#0 系列目录#css
#1 HTTP报文# HTTP报文是面向文本的,报文中的每个字段都是一些ASCII码串,各个字段的长度是不肯定的。HTTP有两类报文:请求报文和响应报文。 ##1.1 HTTP请求报文解剖## ###1.1.1 请求报文结构### HTTP请求报文由3部分组成(请求行+请求头+请求体):html
下面是一个实际的请求报文:前端
①为请求方法,GET和POST是最多见的HTTP方法,除此之外还包括DELETE、HEAD、OPTIONS、PUT、TRACE。不过,当前的大多数浏览器只支持GET和POST,Spring 3.0提供了一个HiddenHttpMethodFilter,容许你经过“_method”的表单参数指定这些特殊的HTTP方法(实际上仍是经过POST提交表单)。服务端配置了HiddenHttpMethodFilter后,Spring会根据_method参数指定的值模拟出相应的HTTP方法,这样,就可使用这些HTTP方法对处理方法进行映射了。 java
GET:最多见的一种请求方式,服务器将URL定位的资源放在响应报文的数据部分,回送给客户端。地址中”?”以后的部分就是经过GET发送的请求数据,各个数据之间用”&”符号隔开。显然,这种方式不适合传送私密数据。另外,因为不一样的浏览器对地址的字符限制也有所不一样,通常最多只能识别1024个字符,因此若是须要传送大量数据的时候,也不适合使用GET方式。web
POST:对于上面提到的不适合使用GET方式的状况,能够考虑使用POST方式,由于使用POST方法能够容许客户端给服务器提供信息较多。POST方法将请求参数封装在HTTP请求数据中,以名称/值的形式出现,能够传输大量数据,这样POST方式对传送的数据大小没有限制,并且也不会显示在URL中。spring
关于HTTP请求GET和POST的区别:浏览器
- GET提交:请求的数据会附在URL以后(就是把数据放置在HTTP协议头<request-line>中),以?分割URL和传输数据,多个参数用&链接。若是数据是英文字母/数字,原样发送,若是是空格,转换为+,若是是中文/其余字符,则直接把字符串用BASE64加密,得出如: %E4%BD%A0%E5%A5%BD,其中%XX中的XX为该符号以16进制表示的ASCII。 POST提交:把提交的数据放置在是HTTP的报文体<request-body>中。 所以,GET提交的数据会在地址栏中显示出来,而POST提交,地址栏不会改变。
- 传输数据的大小: 首先声明,HTTP协议没有对传输的数据大小进行限制,HTTP协议规范也没有对URL长度进行限制。 而在实际开发中存在的限制主要有: GET:特定浏览器和服务器对URL长度有限制,例如IE对URL长度的限制是2083字节(2K+35)。对于其余浏览器,如Netscape、FireFox等,理论上没有长度限制,其限制取决于操做系统的支持。 所以对于GET提交时,传输数据就会受到URL长度的限制。 POST:因为不是经过URL传值,理论上数据不受限。但实际各个WEB服务器会规定对post提交数据大小进行限制,Apache、IIS6都有各自的配置。 3. 安全性: POST的安全性要比GET的安全性高。注意:这里所说的安全性和上面GET提到的“安全”不是同个概念。上面“安全”的含义仅仅是不做数据修改,而这里安全的含义是真正的Security的含义,好比:经过GET提交数据,用户名和密码将明文出如今URL上,由于(1)登陆页面有可能被浏览器缓存,(2)其余人查看浏览器的历史纪录,那么别人就能够拿到你的帐号和密码了,
②为请求对应的URL地址,它和报文头的Host属性组成完整的请求URL。缓存
③为协议名称及版本号。安全
④为HTTP的报文头,报文头包含若干个属性,格式为“属性名:属性值”,服务端据此获取客户端的信息。服务器
⑤为报文体,它将一个页面表单中的组件值经过param1=value1¶m2=value2
的键值对形式编码成一个格式化串,它承载多个请求参数的数据。不但报文体能够传递请求参数,请求URL也能够经过相似于“/chapter15/user.html?param1=value1¶m2=value2
”的方式传递请求参数。
**对照上面的请求报文,咱们把它进一步分解,你能够看到一幅更详细的结构图: **
###1.1.2 HTTP请求报文头属性### 报文头属性是什么东西呢?咱们不妨以一个小故事来讲明吧。
快到中午了,张三丰不想去食堂吃饭,因而打电话叫外卖:老板,我要一份[鱼香肉丝],要12:30以前给我送过来哦,我在江湖湖公司研发部,叫张三丰。
这里,你要[鱼香肉丝]至关于HTTP报文体,而“12:30以前送过来”,你叫“张三丰”等信息就至关于HTTP的报文头。它们是一些附属信息,帮忙你和饭店老板顺利完成此次交易。
请求HTTP报文和响应HTTP报文都拥有若干个报文关属性,它们是为协助客户端及服务端交易的一些附属信息。
请求报文可经过一个“Accept”报文头属性告诉服务端 客户端接受什么类型的响应。
以下报文头至关于告诉服务端,俺客户端可以接受的响应类型仅为纯文本数据啊,你丫别发其它什么图片啊,视频啊过来,那样我会歇菜的~~~:
Accept:text/plain
Accept属性的值能够为一个或多个MIME类型的值,关于MIME类型,你们请参考:http://en.wikipedia.org/wiki/MIME_type
客户端的Cookie就是经过这个报文头属性传给服务端的哦!以下所示:
Cookie: $Version=1; Skin=new;jsessionid=5F4771183629C9834F8382E23BE13C4C
服务端是怎么知道客户端的多个请求是隶属于一个Session呢?注意到后台的那个jsessionid=5F4771183629C9834F8382E23BE13C4C木有?原来就是经过HTTP请求报文头的Cookie属性的jsessionid的值关联起来的!(固然也能够经过重写URL的方式将会话ID附带在每一个URL的后面哦)。
表示这个请求是从哪一个URL过来的,假如你经过google搜索出一个商家的广告页面,你对这个广告页面感兴趣,鼠标一点发送一个请求报文到商家的网站,这个请求报文的Referer报文头属性值就是http://www.google.com。
唐僧到了西天. 如来问:侬是否是从东土大唐来啊? 唐僧:厉害!你咋知道的! 如来:呵呵,我偷看了你的Referer...
不少貌似神奇的网页监控软件(如著名的 我要啦),只要在你的网页上放上一段JavaScript,就能够帮你监控流量,全国访问客户的分布状况等报表和图表,其原理就是经过这个Referer及其它一些HTTP报文头工做的。
对缓存进行控制,如一个请求但愿响应返回的内容在客户端要被缓存一年,或不但愿被缓存就能够经过这个报文头达到目的。
如如下设置,至关于让服务端将对应请求返回的响应内容不要在客户端缓存:
Cache-Control: no-cache ``` 5. **User-Agent:** 产生请求的浏览器类型。 6. **Host:** 请求的主机名,容许多个域名同处一个IP地址,即虚拟主机。 ###1.1.3 如何访问请求报文头### 因为请求报文头是客户端发过来的,服务端固然只能读取了,如下是HttpServletRequest一些用于读取请求报文头的API:
// 获取请求报文中的属性名称 java.util.Enumeration<java.lang.String> getHeaderNames(); // 获取指定名称的报文头属性的值 java.lang.String getHeader(java.lang.String name);
因为一些请求报文头属性“太著名”了,所以HttpServletRequest为它们提供了VIP的API:
// 获取报文头中的Cookie(读取Cookie的报文头属性) Cookie[] getCookies() ; // 获取客户端本地化信息(读取 Accept-Language 的报文头属性) java.util.Locale getLocale() // 获取请求报文体的长度(读取Content-Length的报文头属性) int getContentLength();
// 获取请求所关联的HttpSession,其内部的机理是经过读取请求报文头中Cookie属性的JSESSIONID的值, // 在服务端的一个会话Map中,根据这个JSESSIONID获取对应的HttpSession的对象 HttpSession getSession()
##1.2 HTTP响应报文解剖## ###1.2.1 响应报文结构### HTTP的响应报文也由三部分组成(**响应行+响应头+响应体**):  如下是一个实际的HTTP响应报文:  ①报文协议及版本; ②状态码及状态描述; ③响应报文头,也是由多个属性组成; ④响应报文体,即咱们真正要的“干货”; ###1.2.2 响应状态码### 和请求报文相比,响应报文多了一个“响应状态码”,它以“清晰明确”的语言告诉客户端本次请求的处理结果。 **HTTP的响应状态码由5段组成:** > 1xx 消息,**通常是告诉客户端,请求已经收到了,正在处理**,别急...。 > > 2xx **处理成功**,通常表示:请求收悉、我明白你要的、请求已受理、已经处理完成等信息。 > > 3xx **重定向到其它地方**。它让客户端再发起一个请求以完成整个处理。 > > 4xx **处理发生错误,责任在客户端**,如客户端的请求一个不存在的资源,客户端未被受权,禁止访问等。 > > 5xx **处理发生错误,责任在服务端**,如服务端抛出异常,路由出错,HTTP版本不支持等。 **如下是几个常见的状态码:** > **200 OK** 你最但愿看到的,即处理成功! > > **301 永久重定向** Location响应首部的值仍为当前URL,所以为隐藏重定向; > > **302 临时重定向** 显式重定向, Location响应首部的值为新的URL。 > > **303 See Other** redirect到其它的页面,目标的URL经过响应报文头的Location告诉你。 > > **304 Not Modified** 告诉客户端,你请求的这个资源至你上次取得后,并无更改,你直接用你本地的缓存吧,我很忙哦,你能不能少来烦我啊! > > **400 Bad Request** 客户端请求有语法错误,不能被服务器所理解。 > > **401 Unauthorized** 请求未经受权,这个状态代码必须和WWW-Authenticate报头域一块儿使用。 > > **403 Forbidden** 服务器收到请求,可是拒绝提供服务。 > > **404 Not Found** 你最不但愿看到的,即找不到页面。如你在google上找到一个页面,点击这个连接返回404,表示这个页面已经被网站删除了,google那边的记录只是美好的回忆。 > > **500 Internal Server Error** 看到这个错误,你就应该查查服务端的日志了,确定抛出了一堆异常,别睡了,起来改BUG去吧! > > **503 Server Unavailable** 服务器当前不能处理客户端的请求,一段时间后可能恢复正常,举个例子:HTTP/1.1 200 OK(CRLF)。 其它的状态码参见:[http://en.wikipedia.org/wiki/List_of_HTTP_status_codes](http://en.wikipedia.org/wiki/List_of_HTTP_status_codes) 有些响应码,Web应用服务器会自动给生成。你能够经过HttpServletResponse的API设置状态码:
// 设置状态码,状态码在HttpServletResponse中经过一系列的常量预约义了,如SC_ACCEPTED,SC_OK void setStatus(int sc)
###1.2.3 HTTP响应报文头属性### **Cache-Control:**响应输出到客户端后,服务端经过该报文头属告诉客户端如何控制响应内容的缓存。 下面的设置让客户端对响应内容缓存3600秒,也即在3600秒内,若是客户再次访问该资源,直接从客户端的缓存中返回内容给客户,不要再从服务端获取(固然,这个功能是靠客户端实现的,服务端只是经过这个属性提示客户端“应该这么作”,作不作,仍是决定于客户端,若是是本身宣称支持HTTP的客户端,则就应该这样实现)。
Cache-Control: max-age=3600
**ETag:**一个表明响应服务端资源(如页面)版本的报文头属性,若是某个服务端资源发生变化了,这个ETag就会相应发生变化。它是Cache-Control的有益补充,可让客户端“更智能”地处理何时要从服务端取资源,何时能够直接从缓存中返回响应。 关于ETag的说明,你能够参见:[http://en.wikipedia.org/wiki/HTTP_ETag](http://en.wikipedia.org/wiki/HTTP_ETag)。 Spring 3.0还专门为此提供了一个`org.springframework.web.filter.ShallowEtagHeaderFilter`(实现原理很简单,对JSP输出的内容MD5,这样内容有变化ETag就相应变化了),用于生成响应的ETag,**由于这东东确实能够帮助减小请求和响应的交互**。 下面是一个ETag:
ETag: "737060cd8c284d8af7ad3082f209582d"
**Location:**在JSP中让页面Redirect到一个某个A页面中,实际上是让客户端再发一个请求到A页面,这个须要Redirect到的A页面的URL,其实就是经过响应报文头的Location属性告知客户端的,以下的报文头属性,将使客户端redirect到iteye的首页中。
Location: http://www.iteye.com
**Set-Cookie:**服务端能够设置客户端的Cookie,其原理就是经过这个响应报文头属性实现的。
Set-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1
Connection 使用keep-alive特性; Content-Encoding 使用gzip方式对资源压缩; Content-type MIME类型为html类型,字符集是 UTF-8; Date 响应的日期; Server 使用的WEB服务器; Transfer-Encoding:chunked 分块传输编码 是http中的一种数据传输机制,容许HTTP由网页服务器发送给客户端应用(一般是网页浏览器)的数据能够分红多个部分,分块传输编码只在HTTP协议1.1版本(HTTP/1.1)中提供;
更多其它的HTTP响应头报文,参见:[http://en.wikipedia.org/wiki/List_of_HTTP_header_fields](http://en.wikipedia.org/wiki/List_of_HTTP_header_fields) ###1.2.4 如何写HTTP请求报文头### 在服务端能够经过HttpServletResponse的API写响应报文头的属性:
// 添加一个响应报文头属性 void setHeader(String name, String value)
像Cookie,Location这些响应都是有福之人,HttpServletResponse为它们都提供了VIP版的API:
// 添加Cookie报文头属性 void addCookie(Cookie cookie) // 不但会设置Location的响应报文头,还会生成303的状态码呢,二者天仙配呢 void sendRedirect(String location)
#2 HTTP传输处理# **在一个网络中。传输数据须要面临三个问题:** > 1. 客户端**如何知道所请求内容的位置**? > 2. 当客户端知道所请求内容的位置后,**如何获取所请求的内容**? > 3. 所请求内容以**何种形式组织以便被客户端所识别**? 对于WEB来讲,回答上面三种问题分别采用三种不一样的技术,分别为:**统一资源定位符(URI),超文本传输协议(HTTP)和超文本标记语言(HTML)**。对于大多数WEB开发人员来讲URI和HTML都是很是的熟悉。而HTTP协议在不少WEB技术中都被封装的过多使得HTTP反而最不被熟悉。 HTTP做为一种传输协议,也是像HTML同样随着时间不断演进的,目前流行的HTTP1.1是HTTP协议的第三个版本。 在Internet中全部的传输都是经过TCP/IP进行的。**HTTP协议做为TCP/IP模型中应用层的协议也不例外**。HTTP在网络中的层次如图所示:  能够看出,**HTTP是基于传输层TCP协议的**,而TCP是一个端到端的面向链接的协议。**所谓的端到端能够理解为进程到进程之间的通讯**。因此HTTP在开始传输以前,首先须要创建TCP链接,而TCP链接的过程须要所谓的“三次握手”。概念如图所示。  在TCP三次握手以后,创建了TCP链接,此时HTTP就能够进行传输了。一个重要的概念是面向链接,**即HTTP在传输完成以前并不断开TCP链接**。在HTTP1.1中(经过Connection头设置)这是默认行为。所谓的HTTP传输完成,咱们经过一个具体的例子来看。 好比访问个人博客,使用Fiddler来截取对应的请求和响应。如图所示:  能够看出,虽然仅仅访问了个人博客,但所获取的不只仅是一个HTML,而是浏览器对HTML解析的过程当中,若是发现须要获取的内容,会再次发起HTTP请求去服务器获取,好比上图中的那个common2.css。**这上面19个HTTP请求,只依靠一个TCP链接就够了,这就是所谓的持久链接。**也是所谓的一次HTTP请求完成。 #3 浏览器解析html代码,并请求html代码中的资源# 浏览器拿到index.html文件后,就开始解析其中的html代码,遇到js/css/image等静态资源时,就向服务器端去请求下载(会使用多线程下载,每一个浏览器的线程数不同),**这个时候就用上keep-alive特性了,创建一次HTTP链接,能够请求多个资源,下载资源的顺序就是按照代码里的顺序**,可是因为每一个资源大小不同,而浏览器又多线程请求请求资源,因此从下图看出,这里显示的顺序并不必定是代码里面的顺序。 浏览器在请求静态资源时(在未过时的状况下),向服务器端发起一个http请求(询问自从上一次修改时间到如今有没有对资源进行修改),若是服务器端返回304状态码(告诉浏览器服务器端没有修改),那么浏览器会直接读取本地的该资源的缓存文件。  **浏览器具体渲染页面,内部工做原理,请参考:[《前端必读:浏览器内部工做原理》](http://kb.cnblogs.com/page/129756/)**。