Servlet/JSP技术和ASP、PHP等相比,因为其多线程运行而具备很高的执行效率。因为Servlet/JSP默认是以多线程模式执行的,因此,在编写代码时须要很是细致地考虑多线程的安全性问题。然而,不少人编写Servlet/JSP程序时并无注意到多线程安全性的问题,这每每形成编写的程序在少许用户访问时没有任何问题,而在并发用户上升到必定值时,就会常常出现一些莫明其妙的问题。
Servlet的多线程机制
Servlet体系结构是创建在Java多线程机制之上的,它的生命周期是由Web容器负责的。当客户端第一次请求某个Servlet时,Servlet容器将会根据web.xml配置文件实例化这个Servlet类。当有新的客户端请求该Servlet时,通常不会再实例化该Servlet类,也就是有多个线程在使用这个实例。Servlet容器会自动使用线程池等技术来支持系统的运行。html
这样,当两个或多个线程同时访问同一个Servlet时,可能会发生多个线程同时访问同一资源的状况,数据可能会变得不一致。因此在用Servlet构建的Web应用时若是不注意线程安全的问题,会使所写的Servlet程序有难以发现的错误。
Servlet的线程安全问题
Servlet的线程安全问题主要是因为实例变量使用不当而引发的,这里以一个现实的例子来讲明。
java
Import javax.servlet. *; Import javax.servlet.http. *; Import java.io. *; Public class Concurrent Test extends HttpServlet {web private PrintWriter output; 浏览器 public void service (HttpServletRequest request,HttpServletResponse response) 缓存 throws ServletException, IOException {安全 String username;服务器 response.setContentType ("text/html; charset=gb2312");username = request.getParameter ("username"); output = response.getWriter (); try {Thread. sleep (5000); //为了突出并发问题,在这设置一个延时 }catch (Interrupted Exception e){多线程 }并发 output.println("用户名:"+username+"</br>");} } |
该Servlet中定义了一个实例变量output,在service方法将其赋值为用户的输出。当一个用户访问该Servlet时,程序会正常的运行,但当多个用户并发访问时,就可能会出现其它用户的信息显示在另一些用户的浏览器上的问题。这是一个严重的问题。为了突出并发问题,便于测试、观察,咱们在回显用户信息时执行了一个延时的操做。假设已在web.xml配置文件中注册了该Servlet,现有两个用户a和b同时访问该Servlet(能够启动两个IE浏览器,或者在两台机器上同时访问),即同时在浏览器中输入:
a: http://localhost: 8080/servlet/ConcurrentTest? Username=a
b: http://localhost: 8080/servlet/ConcurrentTest? Username=b性能
Web服务器启动了两个线程分别处理来自用户a和用户b的请求,可是在用户a的浏览器上却获得一个空白的屏幕,用户a的信息显示在用户b的浏览器上。该Servlet存在线程不安全问题。下面咱们就从分析该实例的内存模型入手,观察不一样时刻实例变量output的值来分析使该Servlet线程不安全的缘由。
Java的内存模型JMM(Java Memory Model)JMM主要是为了规定了线程和内存之间的一些关系。根据JMM的设计,系统存在一个主内存(Main Memory),Java中全部实例变量都储存在主存中,对于全部线程都是共享的。每条线程都有本身的工做内存(Working Memory),工做内存由缓存和堆栈两部分组成,缓存中保存的是主存中变量的拷贝,缓存可能并不总和主存同步,也就是缓存中变量的修改可能没有马上写到主存中;堆栈中保存的是线程的局部变量,线程之间没法相互直接访问堆栈中的变量。
根据内存模型来分析当用户a和b的线程(简称为a线程、b线程)并发执行时,Servlet实例中所涉及变量的变化状况及线程的执行状况,如图所示。
调度时刻 | a线程 | b线程 |
T1 | 访问Servlet页面 | |
T2 | 访问Servlet页面 | |
T3 | output=a的输出username=a休眠5000毫秒,让出CPU | |
T4 | output=b的输出(写回主存)username=b休眠5000毫秒,让出CPU | |
T5 | 在用户b的浏览器上输出a线程的username的值,a线程终止。 | |
T6 | 在用户b的浏览器上输出b线程的username的值,b线程终止。 |
图4 Servlet实例的线程调度状况
从图中能够清楚的看到,因为b线程对实例变量output的修改覆盖了a线程对实例变量output的修改,从而致使了用户a的信息显示在了用户b的浏览器上。若是在a线程执行输出语句时,b线程对output的修改尚未刷新到主存,那么将不会出现错误的输出结果了,所以这只是一种偶然现象,但这更增长了程序潜在的危险性。
设计线程安全的Servlet
经过上面的分析,咱们知道了实例变量不正确的使用是形成Servlet线程不安全的主要缘由。下面针对该问题给出了三种解决方案并对方案的选取给出了一些参考性的建议。
一、实现 SingleThreadModel 接口
该接口指定了系统如何处理对同一个Servlet的调用。若是一个Servlet被这个接口指定,那么在这个Servlet中的service方法将不会有两个线程被同时执行,固然也就不存在线程安全的问题。这种方法只要将前面的Concurrent Test类的类头定义更改成:
Public class Concurrent Test extends HttpServlet implements SingleThreadModel { ………… } |
二、同步对共享数据的操做
使用synchronized 关键字能保证一次只有一个线程能够访问被保护的区段,在本论文中的Servlet能够经过同步代码块操做来保证线程的安全。同步后的代码以下:
………… Public class Concurrent Test extends HttpServlet { ………… username = request.getParameter ("username"); Synchronized (this){ output = response.getWriter (); try { Thread. Sleep (5000); } catch (Interrupted Exception e){ } output.println("用户名:"+username+"</br>");} } } |
三、避免使用实例变量
本实例中的线程安全问题是由实例变量形成的,只要在Servlet里面的任何方法里面都不使用实例变量,那么该Servlet就是线程安全的。
修正上面的Servlet代码,将实例变量改成局部变量实现一样的功能,代码以下:
…… Public class Concurrent Test extends HttpServlet { public void service (HttpServletRequest request, HttpServletResponse Response) throws ServletException, IOException {Print Writer output; String username; response.setContentType ("text/html; charset=gb2312"); …… } } |
对上面的三种方法进行测试,能够代表用它们都能设计出线程安全的Servlet程序。可是,若是一个Servlet实现了SingleThreadModel接口,Servlet引擎将为每一个新的请求建立一个单独的Servlet实例,这将引发大量的系统开销。SingleThreadModel在Servlet2.4中已再也不提倡使用;一样若是在程序中使用同步来保护要使用的共享的数据,也会使系统的性能大大降低。这是由于被同步的代码块在同一时刻只能有一个线程执行它,使得其同时处理客户请求的吞吐量下降,并且不少客户处于阻塞状态。另外为保证主存内容和线程的工做内存中的数据的一致性,要频繁地刷新缓存,这也会大大地影响系统的性能。因此在实际的开发中也应避免或最小化 Servlet 中的同步代码;在Servlet中避免使用实例变量是保证Servlet线程安全的最佳选择。从Java 内存模型也能够知道,方法中的临时变量是在栈上分配空间,并且每一个线程都有本身私有的栈空间,因此它们不会影响线程的安全。
小结
Servlet的线程安全问题只有在大量的并发访问时才会显现出来,而且很难发现,所以在编写Servlet程序时要特别注意。线程安全问题主要是由实例变量形成的,所以在Servlet中应避免使用实例变量。若是应用程序设计没法避免使用实例变量,那么使用同步来保护要使用的实例变量,但为保证系统的最佳性能,应该同步可用性最小的代码路径。