session 相关技术

摘要:虽然session机制在web应用程序中被采用已经很长时间了,可是仍然有不少人不清楚session机制的本质,以致不能正确的应用这一技术。本文将详细讨论session的工做机制而且对在Java web application中应用session机制时常见的问题做出解答。

目录:
1、术语session
2、HTTP协议与状态保持
3、理解cookie机制
4、理解session机制
5、理解javax.servlet.http.HttpSession
6、HttpSession常见问题
7、跨应用程序的session共享
8、总结
参考文档

1、术语session
在个人经验里,session这个词被滥用的程度大概仅次于transaction,更加有趣的是transaction与session在某些语境下的含义是相同的。

session,中文常常翻译为会话,其原本的含义是指善始善终的一系列动做/消息,好比打电话时从拿起电话拨号到挂断电话这中间的一系列过程能够称之为一个 session。有时候咱们能够看到这样的话“在一个浏览器会话期间,...”,这里的会话一词用的就是其本义,是指从一个浏览器窗口打开到关闭这个期间 ①。最混乱的是“用户(客户端)在一次会话期间”这样一句话,它可能指用户的一系列动做(通常状况下是同某个具体目的相关的一系列动做,好比从登陆到选购商品到结帐登出这样一个网上购物的过程,有时候也被称为一个transaction),然而有时候也可能仅仅是指一次链接,也有多是指含义①,其中的差异只能靠上下文来推断②。

然而当session一词与网络协议相关联时,它又每每隐含了“面向链接”和/或“保持状态”这样两个含义, “面向链接”指的是在通讯双方在通讯以前要先创建一个通讯的渠道,好比打电话,直到对方接了电话通讯才能开始,与此相对的是写信,在你把信发出去的时候你并不能确认对方的地址是否正确,通讯渠道不必定能创建,但对发信人来讲,通讯已经开始了。“保持状态”则是指通讯的一方可以把一系列的消息关联起来,使得消息之间能够互相依赖,好比一个服务员可以认出再次光临的老顾客而且记得上次这个顾客还欠店里一块钱。这一类的例子有“一个TCP session”或者 “一个POP3 session”③。

而到了web服务器蓬勃发展的时代,session在web开发语境下的语义又有了新的扩展,它的含义是指一类用来在客户端与服务器之间保持状态的解决方案④。有时候session也用来指这种解决方案的存储结构,如“把xxx保存在session 里”⑤。因为各类用于web开发的语言在必定程度上都提供了对这种解决方案的支持,因此在某种特定语言的语境下,session也被用来指代该语言的解决方案,好比常常把Java里提供的javax.servlet.http.HttpSession简称为session⑥。

鉴于这种混乱已不可改变,本文中session一词的运用也会根据上下文有不一样的含义,请你们注意分辨。
在本文中,使用中文“浏览器会话期间”来表达含义①,使用“session机制”来表达含义④,使用“session”表达含义⑤,使用具体的“HttpSession”来表达含义⑥

2、HTTP协议与状态保持
HTTP 协议自己是无状态的,这与HTTP协议原本的目的是相符的,客户端只须要简单的向服务器请求下载某些文件,不管是客户端仍是服务器都没有必要纪录彼此过去的行为,每一次请求之间都是独立的,比如一个顾客和一个自动售货机或者一个普通的(非会员制)大卖场之间的关系同样。

然而聪明(或者贪心?)的人们很快发现若是可以提供一些按需生成的动态信息会使web变得更加有用,就像给有线电视加上点播功能同样。这种需求一方面迫使HTML逐步添加了表单、脚本、DOM等客户端行为,另外一方面在服务器端则出现了CGI规范以响应客户端的动态请求,做为传输载体的HTTP协议也添加了文件上载、 cookie这些特性。其中cookie的做用就是为了解决HTTP协议无状态的缺陷所做出的努力。至于后来出现的session机制则是又一种在客户端与服务器之间保持状态的解决方案。

让咱们用几个例子来描述一下cookie和session机制之间的区别与联系。笔者曾常常去的一家咖啡店有喝5杯咖啡免费赠一杯咖啡的优惠,然而一次性消费5杯咖啡的机会微乎其微,这时就须要某种方式来纪录某位顾客的消费数量。想象一下其实也无外乎下面的几种方案:
一、该店的店员很厉害,能记住每位顾客的消费数量,只要顾客一走进咖啡店,店员就知道该怎么对待了。这种作法就是协议自己支持状态。
二、发给顾客一张卡片,上面记录着消费的数量,通常还有个有效期限。每次消费时,若是顾客出示这张卡片,则这次消费就会与之前或之后的消费相联系起来。这种作法就是在客户端保持状态。
三、发给顾客一张会员卡,除了卡号以外什么信息也不纪录,每次消费时,若是顾客出示该卡片,则店员在店里的纪录本上找到这个卡号对应的纪录添加一些消费信息。这种作法就是在服务器端保持状态。

因为HTTP协议是无状态的,而出于种种考虑也不但愿使之成为有状态的,所以,后面两种方案就成为现实的选择。具体来讲cookie机制采用的是在客户端保持状态的方案,而session机制采用的是在服务器端保持状态的方案。同时咱们也看到,因为采用服务器端保持状态的方案在客户端也须要保存一个标识,因此session机制可能须要借助于cookie机制来达到保存标识的目的,但实际上它还有其余选择。

3、理解cookie机制
cookie机制的基本原理就如上面的例子同样简单,可是还有几个问题须要解决:“会员卡”如何分发;“会员卡”的内容;以及客户如何使用“会员卡”。

正统的cookie分发是经过扩展HTTP协议来实现的,服务器经过在HTTP的响应头中加上一行特殊的指示以提示浏览器按照指示生成相应的cookie。然而纯粹的客户端脚本如JavaScript或者VBScript也能够生成cookie。

而cookie 的使用是由浏览器按照必定的原则在后台自动发送给服务器的。浏览器检查全部存储的cookie,若是某个cookie所声明的做用范围大于等于将要请求的资源所在的位置,则把该cookie附在请求资源的HTTP请求头上发送给服务器。意思是麦当劳的会员卡只能在麦当劳的店里出示,若是某家分店还发行了本身的会员卡,那么进这家店的时候除了要出示麦当劳的会员卡,还要出示这家店的会员卡。

cookie的内容主要包括:名字,值,过时时间,路径和域。
其中域能够指定某一个域好比.google.com,至关于总店招牌,好比宝洁公司,也能够指定一个域下的具体某台机器好比www.google.com或者froogle.google.com,能够用飘柔来作比。
路径就是跟在域名后面的URL路径,好比/或者/foo等等,能够用某飘柔专柜作比。
路径与域合在一块儿就构成了cookie的做用范围。
若是不设置过时时间,则表示这个cookie的生命期为浏览器会话期间,只要关闭浏览器窗口,cookie就消失了。这种生命期为浏览器会话期的 cookie被称为会话cookie。会话cookie通常不存储在硬盘上而是保存在内存里,固然这种行为并非规范规定的。若是设置了过时时间,浏览器就会把cookie保存到硬盘上,关闭后再次打开浏览器,这些cookie仍然有效直到超过设定的过时时间。

存储在硬盘上的cookie 能够在不一样的浏览器进程间共享,好比两个IE窗口。而对于保存在内存里的cookie,不一样的浏览器有不一样的处理方式。对于IE,在一个打开的窗口上按 Ctrl-N(或者从文件菜单)打开的窗口能够与原窗口共享,而使用其余方式新开的IE进程则不能共享已经打开的窗口的内存cookie;对于 Mozilla Firefox0.8,全部的进程和标签页均可以共享一样的cookie。通常来讲是用javascript的window.open打开的窗口会与原窗口共享内存cookie。浏览器对于会话cookie的这种只认cookie不认人的处理方式常常给采用session机制的web应用程序开发者形成很大的困扰。

下面就是一个goolge设置cookie的响应头的例子
HTTP/1.1 302 Found
Location: http://www.google.com/intl/zh-CN/
Set-Cookie: PREF=ID=0565f77e132de138:NW=1:TM=1098082649:LM=1098082649:
S=KaeaCFPo49RiA_d8; expires=Sun, 17-Jan-2038 19:14:07 GMT; path=/; domain=.google.com
Content-Type: text/html

这是使用HTTPLook这个HTTP Sniffer软件来俘获的HTTP通信纪录的一部分

浏览器在再次访问goolge的资源时自动向外发送cookie

使用Firefox能够很容易的观察现有的cookie的值
使用HTTPLook配合Firefox能够很容易的理解cookie的工做原理。

IE也能够设置在接受cookie前询问

这是一个询问接受cookie的对话框。

4、理解session机制
session机制是一种服务器端的机制,服务器使用一种相似于散列表的结构(也可能就是使用散列表)来保存信息。

当程序须要为某个客户端的请求建立一个session的时候,服务器首先检查这个客户端的请求里是否已包含了一个session标识 - 称为 session id,若是已包含一个session id则说明之前已经为此客户端建立过session,服务器就按照session id把这个 session检索出来使用(若是检索不到,可能会新建一个),若是客户端请求不包含session id,则为此客户端建立一个session而且生成一个与此session相关联的session id,session id的值应该是一个既不会重复,又不容易被找到规律以仿造的字符串,这个 session id将被在本次响应中返回给客户端保存。

保存这个session id的方式能够采用cookie,这样在交互过程当中浏览器能够自动的按照规则把这个标识发挥给服务器。通常这个cookie的名字都是相似于SEEESIONID,而。好比weblogic对于web应用程序生成的cookie,JSESSIONID= ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764,它的名字就是 JSESSIONID。

因为cookie能够被人为的禁止,必须有其余机制以便在cookie被禁止时仍然可以把session id传递回服务器。常常被使用的一种技术叫作URL重写,就是把session id直接附加在URL路径的后面,附加方式也有两种,一种是做为URL路径的附加信息,表现形式为 http://...../xxx;jsessionid=
ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764
另外一种是做为查询字符串附加在URL后面,表现形式为 http://...../xxx?jsessionid=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764
这两种方式对于用户来讲是没有区别的,只是服务器在解析的时候处理的方式不一样,采用第一种方式也有利于把session id的信息和正常程序参数区分开来。
为了在整个交互过程当中始终保持状态,就必须在每一个客户端可能请求的路径后面都包含这个session id。

另外一种技术叫作表单隐藏字段。就是服务器会自动修改表单,添加一个隐藏字段,以便在表单提交时可以把session id传递回服务器。好比下面的表单
<form name="testform" action="/xxx">
<input type="text">
</form>
在被传递给客户端以前将被改写成
<form name="testform" action="/xxx">
<input type="hidden" name="jsessionid"
value="ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764">
<input type="text">
</form>
这种技术如今已较少应用,笔者接触过的很古老的iPlanet6(SunONE应用服务器的前身)就使用了这种技术。
实际上这种技术能够简单的用对action应用URL重写来代替。

在谈论session机制的时候,经常听到这样一种误解“只要关闭浏览器,session就消失了”。其实能够想象一下会员卡的例子,除非顾客主动对店家提出销卡,不然店家绝对不会轻易删除顾客的资料。对session来讲也是同样的,除非程序通知服务器删除一个session,不然服务器会一直保留,程序通常都是在用户作log off的时候发个指令去删除session。然而浏览器历来不会主动在关闭以前通知服务器它将要关闭,所以服务器根本不会有机会知道浏览器已经关闭,之因此会有这种错觉,是大部分session机制都使用会话cookie来保存session id,而关闭浏览器后这个 session id就消失了,再次链接服务器时也就没法找到原来的session。若是服务器设置的cookie被保存到硬盘上,或者使用某种手段改写浏览器发出的HTTP请求头,把原来的session id发送给服务器,则再次打开浏览器仍然可以找到原来的session。

偏偏是因为关闭浏览器不会致使session被删除,迫使服务器为seesion设置了一个失效时间,当距离客户端上一次使用session的时间超过这个失效时间时,服务器就能够认为客户端已经中止了活动,才会把session删除以节省存储空间。

5、理解javax.servlet.http.HttpSession
HttpSession是Java平台对session机制的实现规范,由于它仅仅是个接口,具体到每一个web应用服务器的提供商,除了对规范支持以外,仍然会有一些规范里没有规定的细微差别。这里咱们以BEA的Weblogic Server8.1做为例子来演示。

首先,Weblogic Server提供了一系列的参数来控制它的HttpSession的实现,包括使用cookie的开关选项,使用URL重写的开关选项,session持久化的设置,session失效时间的设置,以及针对cookie的各类设置,好比设置cookie的名字、路径、域, cookie的生存时间等。

通常状况下,session都是存储在内存里,当服务器进程被中止或者重启的时候,内存里的session也会被清空,若是设置了session的持久化特性,服务器就会把session保存到硬盘上,当服务器进程从新启动或这些信息将可以被再次使用, Weblogic Server支持的持久性方式包括文件、数据库、客户端cookie保存和复制。

复制严格说来不算持久化保存,由于session实际上仍是保存在内存里,不过一样的信息被复制到各个cluster内的服务器进程中,这样即便某个服务器进程中止工做也仍然能够从其余进程中取得session。

cookie生存时间的设置则会影响浏览器生成的cookie是不是一个会话cookie。默认是使用会话cookie。有兴趣的能够用它来试验咱们在第四节里提到的那个误解。

cookie的路径对于web应用程序来讲是一个很是重要的选项,Weblogic Server对这个选项的默认处理方式使得它与其余服务器有明显的区别。后面咱们会专题讨论。

关于session的设置参考[5] http://e-docs.bea.com/wls/docs70/webapp/weblogic_xml.html#1036869

6、HttpSession常见问题
(在本小节中session的含义为⑤和⑥的混合)


一、session在什么时候被建立
一个常见的误解是觉得session在有客户端访问时就被建立,然而事实是直到某server端程序调用 HttpServletRequest.getSession(true)这样的语句时才被建立,注意若是JSP没有显示的使用 <% @page session="false"%> 关闭session,则JSP文件在编译成Servlet时将会自动加上这样一条语句 HttpSession session = HttpServletRequest.getSession(true);这也是JSP中隐含的 session对象的来历。

因为session会消耗内存资源,所以,若是不打算使用session,应该在全部的JSP中关闭它。

二、session什么时候被删除
综合前面的讨论,session在下列状况下被删除a.程序调用HttpSession.invalidate();或b.距离上一次收到客户端发送的session id时间间隔超过了session的超时设置;或c.服务器进程被中止(非持久session)

三、如何作到在浏览器关闭时删除session
严格的讲,作不到这一点。能够作一点努力的办法是在全部的客户端页面里使用javascript代码window.oncolose来监视浏览器的关闭动做,而后向服务器发送一个请求来删除session。可是对于浏览器崩溃或者强行杀死进程这些很是规手段仍然无能为力。

四、有个HttpSessionListener是怎么回事
你能够建立这样的listener去监控session的建立和销毁事件,使得在发生这样的事件时你能够作一些相应的工做。注意是session的建立和销毁动做触发listener,而不是相反。相似的与HttpSession有关的listener还有 HttpSessionBindingListener,HttpSessionActivationListener和 HttpSessionAttributeListener。

五、存放在session中的对象必须是可序列化的吗
不是必需的。要求对象可序列化只是为了session可以在集群中被复制或者可以持久保存或者在必要时server可以暂时把session交换出内存。在 Weblogic Server的session中放置一个不可序列化的对象在控制台上会收到一个警告。我所用过的某个iPlanet版本若是 session中有不可序列化的对象,在session销毁时会有一个Exception,很奇怪。

六、如何才能正确的应付客户端禁止cookie的可能性
对全部的URL使用URL重写,包括超连接,form的action,和重定向的URL,具体作法参见[6]
http://e-docs.bea.com/wls/docs70/webapp/sessions.html#100770 七、开两个浏览器窗口访问应用程序会使用同一个session仍是不一样的session 参见第三小节对cookie的讨论,对session来讲是只认id不认人,所以不一样的浏览器,不一样的窗口打开方式以及不一样的cookie存储方式都会对这个问题的答案有影响。 八、如何防止用户打开两个浏览器窗口操做致使的session混乱 这个问题与防止表单屡次提交是相似的,能够经过设置客户端的令牌来解决。就是在服务器每次生成一个不一样的id返回给客户端,同时保存在session里,客户端提交表单时必须把这个id也返回服务器,程序首先比较返回的id与保存在session里的值是否一致,若是不一致则说明本次操做已经被提交过了。能够参看《J2EE核心模式》关于表示层模式的部分。须要注意的是对于使用javascript window.open打开的窗口,通常不设置这个id,或者使用单独的id,以防主窗口没法操做,建议不要再window.open打开的窗口里作修改操做,这样就能够不用设置。 九、为何在Weblogic Server中改变session的值后要从新调用一次session.setValue 作这个动做主要是为了在集群环境中提示Weblogic Server session中的值发生了改变,须要向其余服务器进程复制新的session值。 十、为何session不见了 排除session正常失效的因素以外,服务器自己的可能性应该是微乎其微的,虽然笔者在iPlanet6SP1加若干补丁的Solaris版本上倒也遇到过;浏览器插件的可能性次之,笔者也遇到过3721插件形成的问题;理论上防火墙或者代理服务器在cookie处理上也有可能会出现问题。 出现这一问题的大部分缘由都是程序的错误,最多见的就是在一个应用程序中去访问另一个应用程序。咱们在下一节讨论这个问题。 7、跨应用程序的session共享 经常有这样的状况,一个大项目被分割成若干小项目开发,为了可以互不干扰,要求每一个小项目做为一个单独的web应用程序开发,但是到了最后忽然发现某几个小项目之间须要共享一些信息,或者想使用session来实现SSO(single sign on),在session中保存login的用户信息,最天然的要求是应用程序间可以访问彼此的session。 然而按照Servlet规范,session的做用范围应该仅仅限于当前应用程序下,不一样的应用程序之间是不可以互相访问对方的session的。各个应用服务器从实际效果上都遵照了这一规范,可是实现的细节却可能各有不一样,所以解决跨应用程序session共享的方法也各不相同。 首先来看一下Tomcat是如何实现web应用程序之间session的隔离的,从 Tomcat设置的cookie路径来看,它对不一样的应用程序设置的cookie路径是不一样的,这样不一样的应用程序所用的session id是不一样的,所以即便在同一个浏览器窗口里访问不一样的应用程序,发送给服务器的session id也能够是不一样的。 根据这个特性,咱们能够推测Tomcat中session的内存结构大体以下。 笔者之前用过的iPlanet也采用的是一样的方式,估计SunONE与iPlanet之间不会有太大的差异。对于这种方式的服务器,解决的思路很简单,实际实行起来也不难。要么让全部的应用程序共享一个session id,要么让应用程序可以得到其余应用程序的session id。 iPlanet中有一种很简单的方法来实现共享一个session id,那就是把各个应用程序的cookie路径都设为/(实际上应该是/NASApp,对于应用程序来说它的做用至关于根)。 <session-info> <path>/NASApp</path> </session-info> 须要注意的是,操做共享的session应该遵循一些编程约定,好比在session attribute名字的前面加上应用程序的前缀,使得 setAttribute("name", "neo")变成setAttribute("app1.name", "neo"),以防止命名空间冲突,致使互相覆盖。 在Tomcat中则没有这么方便的选择。在Tomcat版本3上,咱们还能够有一些手段来共享session。对于版本4以上的Tomcat,目前笔者还没有发现简单的办法。只能借助于第三方的力量,好比使用文件、数据库、JMS或者客户端cookie,URL参数或者隐藏字段等手段。 咱们再看一下Weblogic Server是如何处理session的。 从截屏画面上能够看到Weblogic Server对全部的应用程序设置的cookie的路径都是/,这是否是意味着在Weblogic Server中默认的就能够共享session了呢?然而一个小实验便可证实即便不一样的应用程序使用的是同一个session,各个应用程序仍然只能访问本身所设置的那些属性。这说明Weblogic Server中的session的内存结构可能以下 对于这样一种结构,在 session机制自己上来解决session共享的问题应该是不可能的了。除了借助于第三方的力量,好比使用文件、数据库、JMS或者客户端 cookie,URL参数或者隐藏字段等手段,还有一种较为方便的作法,就是把一个应用程序的session放到ServletContext中,这样另一个应用程序就能够从ServletContext中取得前一个应用程序的引用。示例代码以下, 应用程序A context.setAttribute("appA", session); 应用程序B contextA = context.getContext("/appA"); HttpSession sessionA = (HttpSession)contextA.getAttribute("appA"); 值得注意的是这种用法不可移植,由于根据ServletContext的JavaDoc,应用服务器能够处于安全的缘由对于context.getContext("/appA");返回空值,以上作法在Weblogic Server 8.1中经过。 那么Weblogic Server为何要把全部的应用程序的cookie路径都设为/呢?原来是为了SSO,凡是共享这个session的应用程序均可以共享认证的信息。一个简单的实验就能够证实这一点,修改首先登陆的那个应用程序的描述符weblogic.xml,把cookie路径修改成/appA 访问另一个应用程序会从新要求登陆,即便是反过来,先访问cookie路径为/的应用程序,再访问修改过路径的这个,虽然再也不提示登陆,可是登陆的用户信息也会丢失。注意作这个实验时认证方式应该使用FORM,由于浏览器和web服务器对basic认证方式有其余的处理方式,第二次请求的认证不是经过 session来实现的。具体请参看[7] secion 14.8 Authorization,你能够修改所附的示例程序来作这些试验。 8、总结 session机制自己并不复杂,然而其实现和配置上的灵活性却使得具体状况复杂多变。这也要求咱们不能把仅仅某一次的经验或者某一个浏览器,服务器的经验看成广泛适用的经验,而是始终须要具体状况具体分析。 摘要:虽然session机制在web应用程序中被采用已经很长时间了,可是仍然有不少人不清楚session机制的本质,以致不能正确的应用这一技术。本文将详细讨论session的工做机制而且对在Java web application中应用session机制时常见的问题做出解答