深刻理解线程局部变量:ThreadLocal

咱们知道Spring经过各类模板类下降了开发者使用各类数据持久技术的难度。这些模板类都是线程安全的,也就是说,多个DAO能够复用同一个模板实例而不会发生冲突。咱们使用模板类访问底层数据,根据持久化技术的不一样,模板类须要绑定数据链接或会话的资源。但这些资源自己是非线程安全的,也就是说它们不能在同一时刻被多个线程共享。虽然模板类经过资源池获取数据链接或会话,但资源池自己解决的是数据链接或会话的缓存问题,并不是数据链接或会话的线程安全问题。
  按照传统经验,若是某个对象是非线程安全的,在多线程环境下,对对象的访问必须采用synchronized进行线程同步。但模板类并未采用线程同步机制,由于线程同步会下降并发性,影响系统性能。此外,经过代码同步解决线程安全的挑战性很大,可能会加强好几倍的实现难度。那么模板类究竟仰仗何种魔法神功,能够在无须线程同步的状况下就化解线程安全的难题呢?答案就是ThreadLocal!
  ThreadLocal在Spring中发挥着重要的做用,在管理request做用域的Bean、事务管理、任务调度、AOP等模块都出现了它们的身影,起着举足轻重的做用。要想了解Spring事务管理的底层技术,ThreadLocal是必须攻克的山头堡垒。
java


1 ThreadLocal概述

早在JDK 1.2的版本中就提供java.lang.ThreadLocal,ThreadLocal为解决多线程程序的并发问题提供了一种新的思路。使用这个工具类能够很简洁地编写出优美的多线程程序。
  ThreadLocal,顾名思义,它不是一个线程,而是线程的一个本地化对象。当工做于多线程中的对象使用ThreadLocal维护变量时,ThreadLocal为每一个使用该变量的线程分配一个独立的变量副本。因此每个线程均可以独立地改变本身的副本,而不会影响其余线程所对应的副本。从线程的角度看,这个变量就像是线程的本地变量,这也是类名中“Local”所要表达的意思。
  线程局部变量并非Java的新发明,不少语言(如IBM XL、FORTRAN)在语法层面就提供线程局部变量。在Java中没有提供语言级支持,而以一种变通的方法,经过ThreadLocal的类提供支持。因此,在Java中编写线程局部变量的代码相对来讲要笨拙一些,这也是为何线程局部变量没有在Java开发者中获得很好普及的缘由。
sql

  学习JDK中的类,首先看下JDK API对此类的描述,描述以下:编程

  该类提供了线程局部 (thread-local) 变量。这些变量不一样于它们的普通对应物,由于访问某个变量(经过其 get 或 set 方法)的每一个线程都有本身的局部变量,它独立于变量的初始化副本。ThreadLocal 实例一般是类中的 private static 字段,它们但愿将状态与某一个线程(例如,用户 ID 或事务 ID)相关联。
  API表达了下面几种观点:
缓存

  一、ThreadLocal不是线程,是线程的一个变量,你能够先简单理解为线程类的属性变量。安全

  二、ThreadLocal在类中一般定义为静态变量。多线程

  三、每一个线程有本身的一个ThreadLocal,它是变量的一个“拷贝”,修改它不影响其余线程。并发

  既然定义为类变量,为什么为每一个线程维护一个副本(姑且称为“拷贝”容易理解),让每一个线程独立访问?多线程编程的经验告诉咱们,对于线程共享资源(你能够理解为属性),资源是否被全部线程共享,也就是说这个资源被一个线程修改是否影响另外一个线程的运行,若是影响咱们须要使用synchronized同步,让线程顺序访问。框架

  ThreadLocal适用于资源共享但不须要维护状态的状况,也就是一个线程对资源的修改,不影响另外一个线程的运行;这种设计是‘空间换时间’,synchronized顺序执行是‘时间换取空间’。ide

2 ThreadLocal方法及使用示例

  ThreadLocal<T>类在Spring,Hibernate等框架中起到了很大的做用。为了解释ThreadLocal类的工做原理,必须同时介绍与其工做甚密的其余几个类,包括内部类ThreadLocalMap,和线程类Thread。全部方法以下图:工具


四个核心方法说明以下:

                   T         get()                   返回此线程局部变量的当前线程副本中的值。

 protected  T         initialValue()       返回此线程局部变量的当前线程的“初始值”。

                   void remove()             移除此线程局部变量当前线程的值。

                   void set(T value)         将此线程局部变量的当前线程副本中的值设置为指定值。


可能有人会以为Thread与ThreadLocal有什么关系,其实真正的奥秘就在Thread类中的一行代码:

ThreadLocal.ThreadLocalMap threadLocals = null;

其中ThreadLocalMap的定义是在ThreadLocal类中,真正的引用倒是在Thread类中。那么ThreadLocalMap到底是什么呢?能够看到这个类应该是一个Map,JDK的解释是:ThreadLocalMap is a customized hash map suitable only for maintaining thread local values。
  接下来的重点是ThreadLocalMap中用于存储数据的entry:


    static class Entry extends WeakReference<ThreadLocal> {  
                /** The value associated with this ThreadLocal. */  
                Object value;  
      
                Entry(ThreadLocal k, Object v) {  
                    super(k);  
                    value = v;  
                }  
            }

从中咱们能够发现这个Map的key是ThreadLocal变量,value为用户的值,并非不少人认为的key是线程的名字或者标识。到这里,咱们就能够理解ThreadLocal到底是如何工做的了。

  1. Thread类中有一个成员变量叫作ThreadLocalMap,它是一个Map,他的Key是ThreadLocal类

  2每一个线程拥有本身的申明为ThreadLocal类型的变量,因此这个类的名字叫ThreadLocal:线程本身的(变量)。

  3. 此变量生命周期是由该线程决定的,开始于第一次初始化(get或者set方法)。

  4. 由ThreadLocal的工做原理决定了:每一个线程独自拥有一个变量,并不是共享或者拷贝。

  下面,咱们经过一个具体的实例了解一下ThreadLocal的具体使用方法。

    package com.baobaotao.basic;  
      
    public class SequenceNumber {  
           
        //①经过匿名内部类覆盖ThreadLocal的initialValue()方法,指定初始值  
        private static ThreadLocal<Integer> seqNum = new ThreadLocal<Integer>(){  
            public Integer initialValue(){  
                return 0;  
            }  
        };  
           
        //②获取下一个序列值  
        public int getNextNum(){  
            seqNum.set(seqNum.get()+1);  
            return seqNum.get();  
        }  
          
        public static void main(String[ ] args)   
        {  
             SequenceNumber sn = new SequenceNumber();  
               
             //③ 3个线程共享sn,各自产生序列号  
             TestClient t1 = new TestClient(sn);    
             TestClient t2 = new TestClient(sn);  
             TestClient t3 = new TestClient(sn);  
             t1.start();  
             t2.start();  
             t3.start();  
        }

        private static class TestClient extends Thread  
        {  
            private SequenceNumber sn;  
            public TestClient(SequenceNumber sn) {  
                this.sn = sn;  
            }  
            public void run()  
            {  
                //④每一个线程打出3个序列值  
                for (int i = 0; i < 3; i++) {  
                    System.out.println("thread["+Thread.currentThread().getName()+  
                            "] sn["+sn.getNextNum()+"]");  
                }
            }  
        }  
    }

一般咱们经过匿名内部类的方式定义ThreadLocal的子类,提供初始的变量值,如①处所示。TestClient线程产生一组序列号,在③处,咱们生成3个TestClient,它们共享同一个SequenceNumber实例。运行以上代码,在控制台上输出如下的结果:


  1. thread[Thread-2] sn[1]  

  2. thread[Thread-0] sn[1]  

  3. thread[Thread-1] sn[1]  

  4. thread[Thread-2] sn[2]  

  5. thread[Thread-0] sn[2]  

  6. thread[Thread-1] sn[2]  

  7. thread[Thread-2] sn[3]  

  8. thread[Thread-0] sn[3]  

  9. thread[Thread-1] sn[3]  


考查输出的结果信息,咱们发现每一个线程所产生的序号虽然都共享同一个Sequence Number实例,但它们并无发生相互干扰的状况,而是各自产生独立的序列号,这是由于咱们经过ThreadLocal为每个线程提供了单独的副本。


  接下来分析一下ThreadLocal的源码,就更加清楚了。


3 深刻源码


    ThreadLocal有一个ThreadLocalMap静态内部类,你能够简单理解为一个Map,这个Map为每一个线程复制一个变量的‘拷贝’存储其中。

    当线程调用ThreadLocal.get()方法获取变量时,首先获取当前线程引用,以此为key去获取响应的ThreadLocalMap,若是此‘Map’不存在则初始化一个,不然返回其中的变量,代码以下:

    public T get() {  
            Thread t = Thread.currentThread();  
            /**  
             * 获得当前线程的ThreadLocalMap  
             */  
            ThreadLocalMap map = getMap(t);  
            if (map != null) {  
                /**  
                 * 在此线程的ThreadLocalMap中查找key为当前ThreadLocal对象的entry  
                 */  
                ThreadLocalMap.Entry e = map.getEntry(this);  
                if (e != null)  
                    return (T)e.value;  
            }  
            return setInitialValue();  
        }  
        
        
    /**   
     * 关键方法,返回当前Thread的ThreadLocalMap   
     * [[[每一个Thread返回各自的ThreadLocalMap,因此各个线程中的ThreadLocal均为独立的]]]   
     */    
    ThreadLocalMap getMap(Thread t) {    
        return t.threadLocals;    
    }

调用get方法若是此Map不存在首先初始化,建立此map,将线程为key,初始化的vlaue存入其中,注意此处的initialValue,咱们能够覆盖此方法,在首次调用时初始化一个适当的值。

  对于ThreadLocal在何处存储变量副本,咱们看getMap方法:获取的是当前线程的ThreadLocal类型的threadLocals属性。显然变量副本存储在每个线程中。

  setInitialValue代码以下:

    private T setInitialValue() {  
            /**  
             * 默认返回null,这个方法为protected能够继承  
             */  
            T value = initialValue();  
            Thread t = Thread.currentThread();  
            ThreadLocalMap map = getMap(t);  
            if (map != null)  
                map.set(this, value);  
            else  
                /**  
                 * 初次建立  
                 */  
                createMap(t, value);  
            return value;  
        }  
        
        /** 
     * 给当前thread初始ThreadlocalMap 
     */  
    void createMap(Thread t, T firstValue) {  
            t.threadLocals = new ThreadLocalMap(this, firstValue);  
        }

set方法相对比较简单,若是理解以上俩个方法。获取当前线程的引用,从map中获取该线程对应的map,若是map存在更新缓存值,不然建立并存储,代码以下:


    public void set(T value) {  
        Thread t = Thread.currentThread();  
        ThreadLocalMap map = getMap(t);  
        if (map != null)  
            map.set(this, value);  
        else  
            createMap(t, value);  
    }

上面咱们知道变量副本存放于何处,这里咱们简单说下如何被java的垃圾收集机制收集,当咱们不在使用时调用set(null),此时不在将引用指向该‘map’,而线程退出时会执行资源回收操做,将申请的资源进行回收,其实就是将属性的引用设置为null。这时已经不在有任何引用指向该map,故而会被垃圾收集。

  咱们本身就能够实现一个简化版本的ThreadLocal,里面有一个Map,用于存储每个线程的变量副本,Map中元素的键为线程对象,而值对应线程的变量副本。

    public class SimpleThreadLocal {

        private Map valueMap = Collections.synchronizedMap(new HashMap()); 
 
        public void set(Object newValue) {  
            //①键为线程对象,值为本线程的变量副本  
            valueMap.put(Thread.currentThread(), newValue);  
        }

        public Object get() {  
            Thread currentThread = Thread.currentThread();  
      
            //②返回本线程对应的变量  
            Object o = valueMap.get(currentThread);   
                      
            //③若是在Map中不存在,放到Map中保存起来  
            if (o == null && !valueMap.containsKey(currentThread)) {  
                o = initialValue();  
                valueMap.put(currentThread, o);  
            }
            return o;  
        }

        public void remove() {  
            valueMap.remove(Thread.currentThread());  
        }

        public Object initialValue() {  
            return null;  
        }  
    }

 虽然上述代码清单中这个ThreadLocal实现版本显得比较幼稚,但它和JDK所提供的ThreadLocal类在实现思路上是很是相近的。


  经过以上的分析,咱们发现,ThreadLocal类的使用虽然是用来解决多线程的问题的,可是仍是有很明显的针对性。最明显的,ThreadLoacl变量的活动范围为某线程,而且个人理解是该线程“专有的,独自霸占”,对该变量的全部操做均有该线程完成!也就是说,ThreadLocal不是用来解决共享,竞争问题的。典型的应用莫过于Spring,Hibernate等框架中对于多线程的处理了。

  下面是hibernate中典型的ThreadLocal的应用:

    private static final ThreadLocal threadSession = new ThreadLocal();    
        
    public static Session getSession() throws InfrastructureException {    
        Session s = (Session) threadSession.get();    
        try {    
            if (s == null) {    
                s = getSessionFactory().openSession();    
                threadSession.set(s);    
            }    
        } catch (HibernateException ex) {    
            throw new InfrastructureException(ex);    
        }    
        return s;    
    }

这段代码,每一个线程有本身的ThreadLocalMap,每一个ThreadLocalMap中根据须要初始加载threadSession,这样的好处就是介于singleton与prototype之间,应用singleton没法解决线程,应用prototype开销又太大,有了ThreadLocal以后就行了,对于须要线程“霸占”的变量用ThreadLocal,而该类实例的方法都可以共享。

  关于内存泄漏:虽然ThreadLocalMap已经使用了weakReference,可是仍是建议可以显示的使用remove方法。


4 与Thread同步机制的比较

       ThreadLocal和线程同步机制相比有什么优点呢?ThreadLocal和线程同步机制都是为了解决多线程中相同变量的访问冲突问题。

  在同步机制中,经过对象的锁机制保证同一时间只有一个线程访问变量。这时该变量是多个线程共享的,使用同步机制要求程序缜密地分析何时对变量进行读写,何时须要锁定某个对象,何时释放对象锁等繁杂的问题,程序设计和编写难度相对较大。
  而ThreadLocal则从另外一个角度来解决多线程的并发访问。ThreadLocal为每个线程提供一个独立的变量副本,从而隔离了多个线程对访问数据的冲突。由于每个线程都拥有本身的变量副本,从而也就没有必要对该变量进行同步了。ThreadLocal提供了线程安全的对象封装,在编写多线程代码时,能够把不安全的变量封装进ThreadLocal。
  因为ThreadLocal中能够持有任何类型的对象,低版本JDK所提供的get()返回的是Object对象,须要强制类型转换。但JDK 5.0经过泛型很好的解决了这个问题,在必定程度上简化ThreadLocal的使用,代码清单9-2就使用了JDK 5.0新的ThreadLocal<T>版本。
  归纳起来讲,对于多线程资源共享的问题,同步机制采用了“以时间换空间”的方式:访问串行化,对象共享化。而ThreadLocal采用了“以空间换时间”的方式:访问并行化,对象独享化。前者仅提供一份变量,让不一样的线程排队访问,然后者为每个线程都提供了一份变量,所以能够同时访问而互不影响。


5 Spring使用ThreadLocal解决线程安全问题

      咱们知道在通常状况下,只有无状态的Bean才能够在多线程环境下共享,在Spring中,绝大部分Bean均可以声明为singleton做用域。就是由于Spring对一些Bean(如RequestContextHolder、TransactionSynchronizationManager、LocaleContextHolder等)中非线程安全的“状态性对象”采用ThreadLocal进行封装,让它们也成为线程安全的“状态性对象”,所以有状态的Bean就可以以singleton的方式在多线程中正常工做了。

  通常的Web应用划分为展示层、服务层和持久层三个层次,在不一样的层中编写对应的逻辑,下层经过接口向上层开放功能调用。在通常状况下,从接收请求到返回响应所通过的全部程序调用都同属于一个线程,如图9-2所示。


这样用户就能够根据须要,将一些非线程安全的变量以ThreadLocal存放,在同一次请求响应的调用线程中,全部对象所访问的同一ThreadLocal变量都是当前线程所绑定的。
  下面的实例可以体现Spring对有状态Bean的改造思路:

  TopicDao:非线程安全

    public class TopicDao {  
      //①一个非线程安全的变量  
      private Connection conn;  
      public void addTopic(){  
           //②引用非线程安全变量  
          Statement stat = conn.createStatement();  
          // …  
      }  
   }  

因为①处的conn是成员变量,由于addTopic()方法是非线程安全的,必须在使用时建立一个新TopicDao实例(非singleton)。下面使用ThreadLocal对conn这个非线程安全的“状态”进行改造:
  TopicDao:线程安全


import java.sql.Connection;  
import java.sql.Statement;  
public class TopicDao {  
     
   //①使用ThreadLocal保存Connection变量  
   private static ThreadLocal<Connection> connThreadLocal = new ThreadLocal<Connection>();  
   
   public static Connection getConnection(){
       //②若是connThreadLocal没有本线程对应的Connection建立一个新的Connection,  
       //并将其保存到线程本地变量中
       if (connThreadLocal.get() == null) {  
           Connection conn = ConnectionManager.getConnection();  
           connThreadLocal.set(conn);  
             return conn;  
       }else{
           //③直接返回线程本地变量  
           return connThreadLocal.get();  
       }
   }

   public void addTopic() {
       //④从ThreadLocal中获取线程对应的  
       Statement stat = getConnection().createStatement();  
   }
}

不一样的线程在使用TopicDao时,先判断connThreadLocal.get()是否为null,若是为null,则说明当前线程尚未对应的Connection对象,这时建立一个Connection对象并添加到本地线程变量中;若是不为null,则说明当前的线程已经拥有了Connection对象,直接使用就能够了。这样,就保证了不一样的线程使用线程相关的Connection,而不会使用其余线程的Connection。所以,这个TopicDao就能够作到singleton共享了。
  固然,这个例子自己很粗糙,将Connection的ThreadLocal直接放在Dao只能作到本Dao的多个方法共享Connection时不发生线程安全问题,但没法和其余Dao共用同一个Connection,要作到同一事务多个Dao共享同一个Connection,必须在一个共同的外部类使用ThreadLocal保存Connection。但这个实例基本上说明了Spring对有状态类线程安全化的解决思路。

参考文献:

http://stamen.iteye.com/blog/1535120

http://ari.iteye.com/blog/757478

相关文章
相关标签/搜索