乐博娱乐»WEB综合»Session机制详解

Session机制详解

来源:justsee 宣布时间:2017-03-06 阅读次数:乐博

  虽然session机制在web应用程序中被接纳已经很长时间了,但是仍然有许多人不清楚session机制的本质,以至不能正确的应用这一技术。本文将详细讨论session的事情机制而且对在Java web application中应用session机制时常见的问题作出解答。

乐博

  一、术语session 

  在我的经验里,session这个词被滥用的水平或许仅次于transaction,越发有趣的是transaction与session在某些语境下的寄义是相同的。 

  session,中文经常翻译为会话,其原来的寄义是指有始有终的一系列行动/消息,好比打电话时从拿起电话拨号到挂断电话这中间的一系列历程可以称之为一个session。有时候我们可以看到这样的话“在一个浏览器会话期间,...”,这里的会话一词用的就是其本义,是指从一个浏览器窗口打开到关闭这个期间①。最杂乱的是“用户(客户端)在一次会话期间”这样一句话,它可能指用户的一系列行动(一般情况下是同某个具体目的相关的一系列行动,好比从登录到选购商品到结账登出这样一个网上购物的历程,有时候也被称为一个transaction),然而有时候也可能仅仅是指一次连接,也有可能是指寄义①,其中的差异只能靠上下文来推断②。 

  然而当session一词与网络协议相关联时,它又往往隐含了“面向连接”和/或“保持状态”这样两个寄义,“面向连接”指的是在通信双方在通信之前要先建树一个通信的渠道,好比打电话,直到对方接了电话通信才气开始,与此相对的是写信,在你把信发出去的时候你并不能确认对方的地址是否正确,通信渠道纷歧定能建树,但对发信人来说,通信已经开始了。“保持状态”则是指通信的一方能够把一系列的消息关联起来,使得消息之间可以相互依赖,好比一个服务员能够认出再次惠临的老主顾而且记得上次这个主顾还欠店里一块钱。这一类的例子有“一个TCP session”或者“一个POP3 session”③。 

  而到了web服务器蓬勃生长的时代,session在web乐博娱乐开发语境下的语义又有了新的扩展,它的寄义是指一类用来在客户端与服务器之间保持状态的解决方案④。有时候session也用来指这种解决方案的存储结构,如“把xxx生存在session里”⑤。由于各种用于web乐博娱乐开发的语言在一定水平上都提供了对这种解决方案的支持,所以在某种特定语言的语境下,session也被用来指代该语言的解决方案,好比经常把Java里提供的javax.servlet.http.HttpSession简称为session⑥。 

  鉴于这种杂乱已不行改变,本文中session一词的运用也会凭据上下文有差异的寄义,请各人注意分辨。 

  在本文中,使用中文“浏览器会话期间”来表达寄义①,使用“session机制”来表达寄义④,使用“session”表达寄义⑤,使用具体的“HttpSession”来表达寄义⑥ 

  二、HTTP协议与状态保持 

  HTTP协议自己是无状态的,这与HTTP协议原来的目的是相符的,客户端只需要简朴的向服务器请求下载某些文件,无论是客户端照旧服务器都没有须要纪录相互已往的行为,每一次请求之间都是独立的,好比一个主顾和一个自动售货机或者一个普通的(非会员制)大卖场之间的关系一样。 

  然而智慧(或者贪心?)的人们很快发现如果能够提供一些按需生成的动态信息会使web变得越发有用,就像给有线电视加上点播功效一样。这种需求一方面迫使HTML逐步添加了表单、脚本、DOM等客户端行为,另一方面在服务器端则泛起了CGI规范以响应客户端的动态请求,作为传输载体的HTTP协议也添加了文件上载、cookie这些特性。其中cookie的作用就是为了解决HTTP协议无状态的缺陷所作出的努力。至于厥后泛起的session机制则是又一种在客户端与服务器之间保持状态的解决方案。 

  让我们用几个例子来描述一下cookie和session机制之间的区别与联系。笔者曾经常去的一家咖啡店有喝5杯咖啡免费赠一杯咖啡的优惠,然而一次性消费5杯咖啡的时机微乎其微,这时就需要某种方式来纪录某位主顾的消费数量。想象一下其实也无外乎下面的几种方案: 

  1、该店的伙计很厉害,能记着每位主顾的消费数量,只要主顾一走进咖啡店,伙计就知道该怎么看待了。这种做法就是协议自己支持状态。 

  2、发给主顾一张卡片,上面纪录着消费的数量,一般另有个有效期限。每次消费时,如果主顾出示这张卡片,则此次消费就会与以前或以后的消费相联系起来。这种做法就是在客户端保持状态。 

  3、发给主顾一张会员卡,除了卡号之外什么信息也不纪录,每次消费时,如果主顾出示该卡片,则伙计在店里的纪录本上找到这个卡号对应的纪录添加一些消费信息。这种做法就是在服务器端保持状态。 

  由于HTTP协议是无状态的,而出于种种考虑也不希望使之成为有状态的,因此,后面两种方案就成为现实的选择。具体来说cookie机制接纳的是在客户端保持状态的方案,而session机制接纳的是在服务器端保持状态的方案。同时我们也看到,由于接纳服务器端保持状态的方案在客户端也需要生存一个标识,所以session机制可能需要借助于cookie机制来到达生存标识的目的,但实际上它另有其他选择。 

  三、理解cookie机制 

  cookie机制的基本原理就如上面的例子一样简朴,但是另有几个问题需要解决:“会员卡”如何分发;“会员卡”的内容;以及客户如何使用“会员卡”。 

  正统的cookie分发是通过扩展HTTP协议来实现的,服务器通过在HTTP的响应头中加上一行特殊的指示以提示浏览器凭据指示生成相应的cookie。然而纯粹的客户端脚本如JavaScript或者VBScript也可以生成cookie。 

  而cookie的使用是由浏览器凭据一定的原则在后台自动发送给服务器的。浏览器检查所有存储的cookie,如果某个cookie所声明的作用规模大于即是将要请求的资源所在的位置,则把该cookie附在请求资源的HTTP请求头上发送给服务器。意思是麦当劳的会员卡只能在麦当劳的店里出示,如果某家分店还刊行了自己的会员卡,那么进这家店的时候除了要出示麦当劳的会员卡,还要出示这家店的会员卡。 

  cookie的内容主要包罗:名字,值,逾期时间,路径和域。 

  其中域可以指定某一个域好比.google.com,相当于总店招牌,好比宝洁公司,也可以指定一个域下的具体某台机器好比www.google.com或者froogle.google.com,可以用飘柔来做比。 

  路径就是跟在域名后面的URL路径,好比/或者/foo等等,可以用某飘柔专柜做比。路径与域合在一起就组成了cookie的作用规模。如果不设置逾期时间,则体现这个cookie的生命期为浏览器会话期间,只要关闭浏览器窗口,cookie就消失了。这种生命期为浏览器会话期的cookie被称为会话cookie。会话cookie一般不存储在硬盘上而是生存在内存里,虽然这种行为并不是规范划定的。如果设置了逾期时间,浏览器就会把cookie生存到硬盘上,关闭后再次打开浏览器,这些cookie仍然有效直到凌驾设定的逾期时间。 

  存储在硬盘上的cookie可以在差异的浏览器进程间共享,好比两个IE窗口。而对于生存在内存里的cookie,差异的浏览器有差异的处置惩罚方式。对于IE,在一个打开的窗口上按Ctrl-N(或者从文件菜单)打开的窗口可以与原窗口共享,而使用其他方式新开的IE进程则不能共享已经打开的窗口的内存cookie;对于Mozilla Firefox0.8,所有的进程和标签页都可以共享同样的cookie。一般来说是用javascript的window.open打开的窗口会与原窗口共享内存cookie。浏览器对于会话cookie的这种只认cookie不认人的处置惩罚方式经常给接纳session机制的web应用程序乐博娱乐开发者造成很大的困扰。 

  下面就是一个goolge设置cookie的响应头的例子 

HTTP/1.1 302 Found 
    Location: http://www.google.com/intl/zh-CN/ 
    Set-Cookie: PREF=ID=0565f77e132de138:NW=1:TM=1098082649:LM=1098082649:S=KaeaCFPo49RiA_d8; 
    expires=Sun, 17-Jan-2038 19:14:07 GMT; path=/; domain=.google.com 
    Content-Type: text/html 

乐博

  这是使用HTTPLook这个HTTP Sniffer软件来俘获的HTTP通讯纪录的一部门:

乐博

  浏览器在再次会见goolge的资源时自动向外发送cookie:

乐博

  使用Firefox可以很容易的视察现有的cookie的值,使用HTTPLook配合Firefox可以很容易的理解cookie的事情原理。

乐博

  IE也可以设置在接受cookie前询问:

  这是一个询问接受cookie的对话框。

  四、理解session机制 

  session机制是一种服务器端的机制,服务器使用一种类似于散列表的结构(也可能就是使用散列表)来生存信息。 

  当程序需要为某个客户端的请求创建一个session的时候,服务器首先检查这个客户端的请求里是否已包罗了一个session标识 - 称为session id,如果已包罗一个session id则说明以前已经为此客户端创建过session,服务器就凭据session id把这个session检索出来使用(如果检索不到,可能会新建一个),如果客户端请求不包罗session id,则为此客户端创建一个session而且生成一个与此session相关联的session id,session id的值应该是一个既不会重复,又不容易被找到纪律以仿造的字符串,这个session id将被在本次响应中返回给客户端生存。 

  生存这个session id的方式可以接纳cookie,这样在交互历程中浏览器可以自动的凭据规则把这个标识发挥给服务器。一般这个cookie的名字都是类似于SEEESIONID,而。好比weblogic对于web应用程序生成的cookie,JSESSIONID=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764,它的名字就是JSESSIONID。 

  由于cookie可以被人为的禁止,必须有其他机制以便在cookie被禁止时仍然能够把session id通报回服务器。经常被使用的一种技术叫做URL重写,就是把session id直接附加在URL路径的后面,附加方式也有两种,一种是作为URL路径的附加信息,体现形式http://...../xxx;jsessionid=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764 

  另一种是作为查询字符串附加在URL后面,体现形式为 http://...../xxx?jsessionid=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764

  这两种方式对于用户来说是没有区此外,只是服务器在解析的时候处置惩罚的方式差异,接纳第一种方式也有利于把session id的信息和正常程序参数区离开来。 

  为了在整个交互历程中始终保持状态,就必须在每个客户端可能请求的路径后面都包罗这个session id。 

  另一种技术叫做表单隐藏字段。就是服务器会自动修改表单,添加一个隐藏字段,以便在表单提交时能够把session id通报回服务器。好比下面的表单: 

 <form name="testform" action="/xxx"> 
 <input type="text"> 
 </form> 

  在被通报给客户端之前将被改写成: 

<form name="testform" action="/xxx"> 
<input type="hidden" name="jsessionid" value="ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764"> 
<input type="text"> 
</form> 

  这种技术现在已较少应用,笔者接触过的很古老的iPlanet6(SunONE应用服务器的前身)就使用了这种技术。 

  实际上这种技术可以简朴的用对action应用URL重写来取代。 

  在谈论session机制的时候,经常听到这样一种误解“只要关闭浏览器,session就消失了”。其实可以想象一下会员卡的例子,除非主主顾动对店家提出销卡,否则店家绝对不会轻易删除主顾的资料。对session来说也是一样的,除非程序通知服务器删除一个session,否则服务器会一直保留,程序一般都是在用户做log off的时候发个指令去删除session。然而浏览器从来不会主动在关闭之前通知服务器它将要关闭,因此服务器基础不会有时机知道浏览器已经关闭,之所以会有这种错觉,是大部门session机制都使用会话cookie来生存session id,而关闭浏览器后这个session id就消失了,再次连接服务器时也就无法找到原来的session。如果服务器设置的cookie被生存到硬盘上,或者使用某种手段改写浏览器发出的HTTP请求头,把原来的session id发送给服务器,则再次打开浏览器仍然能够找到原来的session。 

  恰恰是由于关闭浏览器不会导致session被删除,迫使服务器为seesion设置了一个失效时间,当距离客户端上一次使用session的时间凌驾这个失效时间时,服务器就可以认为客户端已经停止了运动,才会把session删除以节省存储空间。 

  五、理解javax.servlet.http.HttpSession 

  HttpSession是Java平台对session机制的实现规范,因为它仅仅是个接口,具体到每个web应用服务器的提供商,除了对规范支持之外,仍然会有一些规范里没有划定的细微差异。这里我们以BEA的Weblogic Server8.1作为例子来演示。 

  首先,Weblogic Server提供了一系列的参数来控制它的HttpSession的实现,包罗使用cookie的开关选项,使用URL重写的开关选项,session持久化的设置,session失效时间的设置,以及针对cookie的各种设置,好比设置cookie的名字、路径、域,cookie的生存时间等。 

  一般情况下,session都是存储在内存里,当服务器进程被停止或者重启的时候,内存里的session也会被清空,如果设置了session的持久化特性,服务器就会把session生存到硬盘上,当服务器进程重新启动或这些信息将能够被再次使用,Weblogic Server支持的持久性方式包罗文件、数据库、客户端cookie生存和复制。 

  复制严格说来不算持久化生存,因为session实际上照旧生存在内存里,不外同样的信息被复制到各个cluster内的服务器进程中,这样纵然某个服务器进程停止事情也仍然可以从其他进程中取得session。 

  cookie生存时间的设置则会影响浏览器生成的cookie是否是一个会话cookie。默认是使用会话cookie。有兴趣的可以用它来试验我们在第四节里提到的那个误解。 

  cookie的路径对于web应用程序来说是一个很是重要的选项,Weblogic Server对这个选项的默认处置惩罚方式使得它与其他服务器有明显的区别。后面我们会专题讨论。 

  关于session的设置参考[5] http://e-docs.bea.com/wls/docs70/webapp/weblogic_xml.html#1036869 

  六、HttpSession常见问题(在本小节中session的寄义为⑤和⑥的混淆) 

  1、session在何时被创建 

  一个常见的误解是以为session在有客户端会见时就被创建,然而事实是直到某server端程序调用HttpServletRequest.getSession(true)这样的语句时才被创建,注意如果JSP没有显示的使用 <%@page session="false"%> 关闭session,则JSP文件在编译成Servlet时将会自动加上这样一条语句HttpSession session = HttpServletRequest.getSession(true);这也是JSP中隐含的session工具的来历。 

  由于session会消耗内存资源,因此,如果不计划使用session,应该在所有的JSP中关闭它。 

  2、session何时被删除 

  综合前面的讨论,session在下列情况下被删除a.程序调用HttpSession.invalidate();或b.距离上一次收到客户端发送的session id时间间隔凌驾了session的超时设置;或c.服务器进程被停止(非持久session) 

  3、如何做到在浏览器关闭时删除session 

  严格的讲,做不到这一点。可以做一点努力的措施是在所有的客户端页面里使用javascript代码window.oncolose来监视浏览器的关闭行动,然后向服务器发送一个请求来删除session。但是对于浏览器瓦解或者强行杀死进程这些非通例手段仍然无能为力。 

  4、有个HttpSessionListener是怎么回事 

  你可以创建这样的listener去监控session的创建和销毁事件,使得在发生这样的事件时你可以做一些相应的事情。注意是session的创建和销毁行动触发listener,而不是相反。类似的与HttpSession有关的listener另有HttpSessionBindingListener,HttpSessionActivationListener和HttpSessionAttributeListener。 

  5、存放在session中的工具必须是可序列化的吗 

  不是必须的。要求工具可序列化只是为了session能够在集群中被复制或者能够持久生存或者在须要时server能够暂时把session交流出内存。在Weblogic Server的session中放置一个不行序列化的工具在控制台上会收到一个警告。我所用过的某个iPlanet版本如果session中有不行序列化的工具,在session销毁时会有一个Exception,很奇怪。 

  6、如何才气正确的应付客户端禁止cookie的可能性 

  对所有的URL使用URL重写,包罗超链接,form的action,和重定向的URL,具体做法参见[6] 

  http://e-docs.bea.com/wls/docs70/webapp/sessions.html#100770 

  7、开两个浏览器窗口会见应用程序会使用同一个session照旧差异的session 

  参见第三小节对cookie的讨论,对session来说是只认id不认人,因此差异的浏览器,差异的窗口打开方式以及差异的cookie存储方式都市对这个问题的答案有影响。 

  8、如何防止用户打开两个浏览器窗口操作导致的session杂乱 

  这个问题与防止表单多次提交是类似的,可以通过设置客户端的令牌来解决。就是在服务器每次生成一个差异的id返回给客户端,同时生存在session里,客户端提交表单时必须把这个id也返回服务器,程序首先比力返回的id与生存在session里的值是否一致,如果纷歧致则说明本次操作已经被提交过了。可以参看《J2EE焦点模式》关于体现层模式的部门。需要注意的是对于使用javascript window.open打开的窗口,一般不设置这个id,或者使用单独的id,以防主窗口无法操作,建议不要再window.open打开的窗口里做修改操作,这样就可以不用设置。 

  9、为什么在Weblogic Server中改变session的值后要重新调用一次session.setValue 

  做这个行动主要是为了在集群情况中提示Weblogic Server session中的值发生了改变,需要向其他服务器进程复制新的session值。 

  10、为什么session不见了 

  排除session正常失效的因素之外,服务器自己的可能性应该是微乎其微的,虽然笔者在iPlanet6SP1加若干补丁的Solaris版本上倒也遇到过;浏览器插件的可能性次之,笔者也遇到过3721插件造成的问题;理论上防火墙或者署理服务器在cookie处置惩罚上也有可能会泛起问题。 

  泛起这一问题的大部门原因都是程序的错误,最常见的就是在一个应用程序中去会见另外一个应用程序。我们在下一节讨论这个问题。 

  七、跨应用程序的session共享 

  经常有这样的情况,一个大项目被支解成若干小项目乐博娱乐开发,为了能够互不滋扰,要求每个小项目作为一个单独的web应用程序乐博娱乐开发,可是到了最后突然发现某几个小项目之间需要共享一些信息,或者想使用session来实现SSO(single sign on),在session中生存login的用户信息,最自然的要求是应用程序间能够会见相互的session。 

  然而凭据Servlet规范,session的作用规模应该仅仅限于当前应用程序下,差异的应用程序之间是不能够相互会见对方的session的。各个应用服务器从实际效果上都遵守了这一规范,但是实现的细节却可能各有差异,因此解决跨应用程序session共享的要领也各不相同。 

  首先来看一下Tomcat是如何实现web应用程序之间session的隔离的,从Tomcat设置的cookie路径来看,它对差异的应用程序设置的cookie路径是差异的,这样差异的应用程序所用的session id是差异的,因此纵然在同一个浏览器窗口里会见差异的应用程序,发送给服务器的session id也可以是差异的。

乐博

 乐博

  凭据这个特性,我们可以推测Tomcat中session的内存结构大致如下。

乐博

  笔者以前用过的iPlanet也接纳的是同样的方式,预计SunONE与iPlanet之间不会有太大的差异。对于这种方式的服务器,解决的思路很简朴,实际实行起来也不难。要么让所有的应用程序共享一个session id,要么让应用程序能够获得其他应用程序的session id。 

  iPlanet中有一种很简朴的要领来实现共享一个session id,那就是把各个应用程序的cookie路径都设为/(实际上应该是/NASApp,对于应用程序来讲它的作用相当于根)。 

<session-info> 
<path>/NASApp</path> 
</session-info> 

  需要注意的是,操作共享的session应该遵循一些编程约定,好比在session attribute名字的前面加上应用程序的前缀,使得setAttribute("name", "neo")酿成setAttribute("app1.name", "neo"),以防止命名空间冲突,导致相互笼罩。 

  在Tomcat中则没有这么方便的选择。在Tomcat版本3上,我们还可以有一些手段来共享session。对于版本4以上的Tomcat,目前笔者尚未发现简朴的措施。只能借助于第三方的力量,好比使用文件、数据库、JMS或者客户端cookie,URL参数或者隐藏字段等手段。 

  我们再看一下Weblogic Server是如那边置惩罚session的。

乐博

乐博

  从截屏画面上可以看到Weblogic Server对所有的应用程序设置的cookie的路径都是/,这是不是意味着在Weblogic Server中默认的就可以共享session了呢?然而一个小实验即可证明纵然差异的应用程序使用的是同一个session,各个应用程序仍然只能会见自己所设置的那些属性。这说明Weblogic Server中的session的内存结构可能如下:

乐博

  对于这样一种结构,在session机制自己上来解决session共享的问题应该是不行能的了。除了借助于第三方的力量,好比使用文件、数据库、JMS或者客户端cookie,URL参数或者隐藏字段等手段,另有一种较为方便的做法,就是把一个应用程序的session放到ServletContext中,这样另外一个应用程序就可以从ServletContext中取得前一个应用程序的引用。示例代码如下, 

  应用程序A :

context.setAttribute("appA", session); 

  应用程序B :

contextA = context.getContext("/appA"); 

HttpSession sessionA = (HttpSession)contextA.getAttribute("appA"); 

  值得注意的是这种用法不行移植,因为凭据ServletContext的JavaDoc,应用服务器可以处于宁静的原因对于context.getContext("/appA");返回空值,以上做法在Weblogic Server 8.1中通过。 

  那么Weblogic Server为什么要把所有的应用程序的cookie路径都设为/呢?原来是为了SSO,通常共享这个session的应用程序都可以共享认证的信息。一个简朴的实验就可以证明这一点,修改首先登录的那个应用程序的描述符weblogic.xml,把cookie路径修改为/appA会见另外一个应用程序会重新要求登录,纵然是反过来,先会见cookie路径为/的应用程序,再会见修悔改路径的这个,虽然不再提示登录,但是登录的用户信息也会丢失。注意做这个实验时认证方式应该使用FORM,因为浏览器和web服务器对basic认证方式有其他的处置惩罚方式,第二次请求的认证不是通过session来实现的。具体请参看[7] secion 14.8 Authorization,你可以修改所附的示例程序来做这些试验。 

  八、总结 

  session机制自己并不庞大,然而其实现和配置上的灵活性却使得具体情况庞大多变。这也要求我们不能把仅仅某一次的经验或者某一个浏览器,服务器的经验看成普遍适用的经验,而是始终需要具体情况具体分析。 

  谢谢作者:郎云鹏。