Java单例模式中双重检查锁

在这转发一篇有level的博客
转至:http://www.javashuo.com/article/p-naisdsey-a.html
清单 1. 单例建立习语java

复制代码程序员

import java.util.*;
class Singleton
{
private static Singleton instance;
private Vector v;
private boolean inUse;编程

private Singleton()
{
v = new Vector();
v.addElement(new Object());
inUse = true;
}设计模式

public static Singleton getInstance()
{
if (instance == null) //1
instance = new Singleton(); //2
return instance; //3
}
}
复制代码安全

此类的设计确保只建立一个 Singleton 对象。构造函数被声明为 private,getInstance() 方法只建立一个对象。这个实现适合于单线程程序。然而,当引入多线程时,就必须经过同步来保护 getInstance() 方法。若是不保护 getInstance() 方法,则可能返回Singleton 对象的两个不一样的实例。假设两个线程并发调用 getInstance() 方法而且按如下顺序执行调用:多线程

线程 1 调用 getInstance() 方法并决定 instance 在 //1 处为 null。 并发

线程 1 进入 if 代码块,但在执行 //2 处的代码行时被线程 2 预占。 app

线程 2 调用 getInstance() 方法并在 //1 处决定 instance 为 null。 编程语言

线程 2 进入 if 代码块并建立一个新的 Singleton 对象并在 //2 处将变量 instance 分配给这个新对象。 ide

线程 2 在 //3 处返回 Singleton 对象引用。

线程 2 被线程 1 预占。

线程 1 在它中止的地方启动,并执行 //2 代码行,这致使建立另外一个 Singleton 对象。

线程 1 在 //3 处返回这个对象。
结果是 getInstance() 方法建立了两个 Singleton 对象,而它本该只建立一个对象。经过同步 getInstance() 方法从而在同一时间只容许一个线程执行代码,这个问题得以改正,如清单 2 所示:

清单 2. 线程安全的 getInstance() 方法

public static synchronized Singleton getInstance()
{
if (instance == null) //1
instance = new Singleton(); //2
return instance; //3
}

清单 2 中的代码针对多线程访问 getInstance() 方法运行得很好。然而,当分析这段代码时,您会意识到只有在第一次调用方法时才须要同步。因为只有第一次调用执行了 //2 处的代码,而只有此行代码须要同步,所以就无需对后续调用使用同步。全部其余调用用于决定 instance 是非 null 的,并将其返回。多线程可以安全并发地执行除第一次调用外的全部调用。尽管如此,因为该方法是synchronized 的,须要为该方法的每一次调用付出同步的代价,即便只有第一次调用须要同步。

为使此方法更为有效,一个被称为双重检查锁定的习语就应运而生了。这个想法是为了不对除第一次调用外的全部调用都实行同步的昂贵代价。同步的代价在不一样的 JVM 间是不一样的。在早期,代价至关高。随着更高级的 JVM 的出现,同步的代价下降了,但出入synchronized 方法或块仍然有性能损失。不考虑 JVM 技术的进步,程序员们毫不想没必要要地浪费处理时间。

由于只有清单 2 中的 //2 行须要同步,咱们能够只将其包装到一个同步块中,如清单 3 所示:

清单 3. getInstance() 方法

复制代码

public static Singleton getInstance()
{
if (instance == null)
{
synchronized(Singleton.class) {
instance = new Singleton();
}
}
return instance;
}
复制代码

清单 3 中的代码展现了用多线程加以说明的和清单 1 相同的问题。当 instance 为 null 时,两个线程能够并发地进入 if 语句内部。而后,一个线程进入 synchronized 块来初始化 instance,而另外一个线程则被阻断。当第一个线程退出 synchronized 块时,等待着的线程进入并建立另外一个 Singleton 对象。注意:当第二个线程进入 synchronized 块时,它并无检查 instance 是否非 null。

双重检查锁定

为处理清单 3 中的问题,咱们须要对 instance 进行第二次检查。这就是“双重检查锁定”名称的由来。将双重检查锁定习语应用到清单 3 的结果就是清单 4 。

清单 4. 双重检查锁定示例

复制代码

public static Singleton getInstance()
{
if (instance == null)
{
synchronized(Singleton.class) { //1
if (instance == null) //2
instance = new Singleton(); //3
}
}
return instance;
}
复制代码

双重检查锁定背后的理论是:在 //2 处的第二次检查使(如清单 3 中那样)建立两个不一样的 Singleton 对象成为不可能。假设有下列事件序列:

线程 1 进入 getInstance() 方法。

因为 instance 为 null,线程 1 在 //1 处进入 synchronized 块。

线程 1 被线程 2 预占。

线程 2 进入 getInstance() 方法。

因为 instance 仍旧为 null,线程 2 试图获取 //1 处的锁。然而,因为线程 1 持有该锁,线程 2 在 //1 处阻塞。

线程 2 被线程 1 预占。

线程 1 执行,因为在 //2 处实例仍旧为 null,线程 1 还建立一个 Singleton 对象并将其引用赋值给 instance。

线程 1 退出 synchronized 块并从 getInstance() 方法返回实例。

线程 1 被线程 2 预占。

线程 2 获取 //1 处的锁并检查 instance 是否为 null。

因为 instance 是非 null 的,并无建立第二个 Singleton 对象,由线程 1 建立的对象被返回。
双重检查锁定背后的理论是完美的。不幸地是,现实彻底不一样。双重检查锁定的问题是:并不能保证它会在单处理器或多处理器计算机上顺利运行。

双重检查锁定失败的问题并不归咎于 JVM 中的实现 bug,而是归咎于 Java 平台内存模型。内存模型容许所谓的“无序写入”,这也是这些习语失败的一个主要缘由。

无序写入

为解释该问题,须要从新考察上述清单 4 中的 //3 行。此行代码建立了一个 Singleton 对象并初始化变量 instance 来引用此对象。这行代码的问题是:在 Singleton 构造函数体执行以前,变量 instance 可能成为非 null 的。

什么?这一说法可能让您始料未及,但事实确实如此。在解释这个现象如何发生前,请先暂时接受这一事实,咱们先来考察一下双重检查锁定是如何被破坏的。假设清单 4 中代码执行如下事件序列:

线程 1 进入 getInstance() 方法。

因为 instance 为 null,线程 1 在 //1 处进入 synchronized 块。

线程 1 前进到 //3 处,但在构造函数执行以前,使实例成为非 null。

线程 1 被线程 2 预占。

线程 2 检查实例是否为 null。由于实例不为 null,线程 2 将 instance 引用返回给一个构造完整但部分初始化了的 Singleton对象。

线程 2 被线程 1 预占。

线程 1 经过运行 Singleton 对象的构造函数并将引用返回给它,来完成对该对象的初始化。
此事件序列发生在线程 2 返回一个还没有执行构造函数的对象的时候。

为展现此事件的发生状况,假设为代码行 instance =new Singleton(); 执行了下列伪代码: instance =new Singleton();

mem = allocate(); //Allocate memory for Singleton object.
instance = mem; //Note that instance is now non-null, but
//has not been initialized.
ctorSingleton(instance); //Invoke constructor for Singleton passing
//instance.

这段伪代码不只是可能的,并且是一些 JIT 编译器上真实发生的。执行的顺序是颠倒的,但鉴于当前的内存模型,这也是容许发生的。JIT 编译器的这一行为使双重检查锁定的问题只不过是一次学术实践而已。

为说明这一状况,假设有清单 5 中的代码。它包含一个剥离版的 getInstance() 方法。我已经删除了“双重检查性”以简化咱们对生成的汇编代码(清单 6)的回顾。咱们只关心 JIT 编译器如何编译 instance=new Singleton(); 代码。此外,我提供了一个简单的构造函数来明确说明汇编代码中该构造函数的运行状况。

清单 5. 用于演示无序写入的单例类

复制代码

class Singleton
{
private static Singleton instance;
private boolean inUse;
private int val;

private Singleton()
{
inUse = true;
val = 5;
}
public static Singleton getInstance()
{
if (instance == null)
instance = new Singleton();
return instance;
}
}
复制代码

清单 6 包含由 Sun JDK 1.2.1 JIT 编译器为清单 5 中的 getInstance() 方法体生成的汇编代码。

清单 6. 由清单 5 中的代码生成的汇编代码

复制代码

;asm code generated for getInstance
054D20B0 mov eax,[049388C8] ;load instance ref
054D20B5 test eax,eax ;test for null
054D20B7 jne 054D20D7
054D20B9 mov eax,14C0988h
054D20BE call 503EF8F0 ;allocate memory
054D20C3 mov [049388C8],eax ;store pointer in
;instance ref. instance
;non-null and ctor
;has not run
054D20C8 mov ecx,dword ptr [eax]
054D20CA mov dword ptr [ecx],1 ;inline ctor - inUse=true;
054D20D0 mov dword ptr [ecx+4],5 ;inline ctor - val=5;
054D20D7 mov ebx,dword ptr ds:[49388C8h]
054D20DD jmp 054D20B0
复制代码

注: 为引用下列说明中的汇编代码行,我将引用指令地址的最后两个值,由于它们都以 054D20 开头。例如,B5 表明 test eax,eax。

汇编代码是经过运行一个在无限循环中调用 getInstance() 方法的测试程序来生成的。程序运行时,请运行 Microsoft Visual C++ 调试器并将其附到表示测试程序的 Java 进程中。而后,中断执行并找到表示该无限循环的汇编代码。

B0 和 B5 处的前两行汇编代码将 instance 引用从内存位置 049388C8 加载至 eax 中,并进行 null 检查。这跟清单 5 中的getInstance() 方法的第一行代码相对应。第一次调用此方法时,instance 为 null,代码执行到 B9。BE 处的代码为 Singleton 对象从堆中分配内存,并将一个指向该块内存的指针存储到 eax 中。下一行代码,C3,获取 eax 中的指针并将其存储回内存位置为049388C8 的实例引用。结果是,instance 如今为非 null 并引用一个有效的 Singleton 对象。然而,此对象的构造函数还没有运行,这恰是破坏双重检查锁定的状况。而后,在 C8 行处,instance 指针被解除引用并存储到 ecx。CA 和 D0 行表示内联的构造函数,该构造函数将值 true 和 5 存储到 Singleton 对象。若是此代码在执行 C3 行后且在完成该构造函数前被另外一个线程中断,则双重检查锁定就会失败。

不是全部的 JIT 编译器都生成如上代码。一些生成了代码,从而只在构造函数执行后使 instance 成为非 null。针对 Java 技术的 IBM SDK 1.3 版和 Sun JDK 1.3 都生成这样的代码。然而,这并不意味着应该在这些实例中使用双重检查锁定。该习语失败还有一些其余缘由。此外,您并不总能知道代码会在哪些 JVM 上运行,而 JIT 编译器老是会发生变化,从而生成破坏此习语的代码。

双重检查锁定:获取两个

考虑到当前的双重检查锁定不起做用,我加入了另外一个版本的代码,如清单 7 所示,从而防止您刚才看到的无序写入问题。

清单 7. 解决无序写入问题的尝试

复制代码

public static Singleton getInstance()
{
if (instance == null)
{
synchronized(Singleton.class) { //1
Singleton inst = instance; //2
if (inst == null)
{
synchronized(Singleton.class) { //3
inst = new Singleton(); //4
}
instance = inst; //5
}
}
}
return instance;
}
复制代码

看着清单 7 中的代码,您应该意识到事情变得有点荒谬。请记住,建立双重检查锁定是为了不对简单的三行 getInstance() 方法实现同步。清单 7 中的代码变得难于控制。另外,该代码没有解决问题。仔细检查可获悉缘由。

此代码试图避免无序写入问题。它试图经过引入局部变量 inst 和第二个 synchronized 块来解决这一问题。该理论实现以下:

线程 1 进入 getInstance() 方法。

因为 instance 为 null,线程 1 在 //1 处进入第一个 synchronized 块。

局部变量 inst 获取 instance 的值,该值在 //2 处为 null。

因为 inst 为 null,线程 1 在 //3 处进入第二个 synchronized 块。

线程 1 而后开始执行 //4 处的代码,同时使 inst 为非 null,但在 Singleton 的构造函数执行前。(这就是咱们刚才看到的无序写入问题。)

线程 1 被线程 2 预占。

线程 2 进入 getInstance() 方法。

因为 instance 为 null,线程 2 试图在 //1 处进入第一个 synchronized 块。因为线程 1 目前持有此锁,线程 2 被阻断。

线程 1 而后完成 //4 处的执行。

线程 1 而后将一个构造完整的 Singleton 对象在 //5 处赋值给变量 instance,并退出这两个 synchronized 块。

线程 1 返回 instance。

而后执行线程 2 并在 //2 处将 instance 赋值给 inst。

线程 2 发现 instance 为非 null,将其返回。
这里的关键行是 //5。此行应该确保 instance 只为 null 或引用一个构造完整的 Singleton 对象。该问题发生在理论和实际彼此背道而驰的状况下。

因为当前内存模型的定义,清单 7 中的代码无效。Java 语言规范(Java Language Specification,JLS)要求不能将 synchronized块中的代码移出来。可是,并无说不能将 synchronized 块外面的代码移入 synchronized 块中。

JIT 编译器会在这里看到一个优化的机会。此优化会删除 //4 和 //5 处的代码,组合而且生成清单 8 中所示的代码。

清单 8. 从清单 7 中优化来的代码。
复制代码

public static Singleton getInstance()
{
if (instance == null)
{
synchronized(Singleton.class) { //1
Singleton inst = instance; //2
if (inst == null)
{
synchronized(Singleton.class) { //3
//inst = new Singleton(); //4
instance = new Singleton();
}
//instance = inst; //5
}
}
}
return instance;
}
复制代码

若是进行此项优化,您将一样遇到咱们以前讨论过的无序写入问题。

用 volatile 声明每个变量怎么样?

另外一个想法是针对变量 inst 以及 instance 使用关键字 volatile。根据 JLS(参见 参考资料),声明成 volatile 的变量被认为是顺序一致的,即,不是从新排序的。可是试图使用 volatile 来修正双重检查锁定的问题,会产生如下两个问题:

这里的问题不是有关顺序一致性的,而是代码被移动了,不是从新排序。

即便考虑了顺序一致性,大多数的 JVM 也没有正确地实现 volatile。
第二点值得展开讨论。假设有清单 9 中的代码:

清单 9. 使用了 volatile 的顺序一致性

复制代码

class test
{
private volatile boolean stop = false;
private volatile int num = 0;

public void foo()
{
num = 100; //This can happen second
stop = true; //This can happen first
//...
}

public void bar()
{
if (stop)
num += num; //num can == 0!
}
//...
}
复制代码

根据 JLS,因为 stop 和 num 被声明为 volatile,它们应该顺序一致。这意味着若是 stop 曾经是 true,num 必定曾被设置成 100。尽管如此,由于许多 JVM 没有实现 volatile 的顺序一致性,您就不能依赖此行为。所以,若是线程 1 调用 foo 而且线程 2 并发地调用 bar,则线程 1 可能在 num 被设置成为 100 以前将 stop 设置成 true。这将致使线程见到 stop 是 true,而 num 仍被设置成 0。使用 volatile 和 64 位变量的原子数还有另一些问题,但这已超出了本文的讨论范围。有关此主题的更多信息,请参阅 参考资料。

解决方案

底线就是:不管以何种形式,都不该使用双重检查锁定,由于您不能保证它在任何 JVM 实现上都能顺利运行。JSR-133 是有关内存模型寻址问题的,尽管如此,新的内存模型也不会支持双重检查锁定。所以,您有两种选择:

接受如清单 2 中所示的 getInstance() 方法的同步。

放弃同步,而使用一个 static 字段。
选择项 2 如清单 10 中所示

清单 10. 使用 static 字段的单例实现

复制代码

class Singleton
{
private Vector v;
private boolean inUse;
private static Singleton instance = new Singleton();

private Singleton()
{
v = new Vector();
inUse = true;
//...
}

public static Singleton getInstance()
{
return instance;
}
}
复制代码

清单 10 的代码没有使用同步,而且确保调用 static getInstance() 方法时才建立 Singleton。若是您的目标是消除同步,则这将是一个很好的选择。

String 不是不变的

鉴于无序写入和引用在构造函数执行前变成非 null 的问题,您可能会考虑 String 类。假设有下列代码:

private String str;
//...
str = new String("hello");

String 类应该是不变的。尽管如此,鉴于咱们以前讨论的无序写入问题,那会在这里致使问题吗?答案是确定的。考虑两个线程访问String str。一个线程能看见 str 引用一个 String 对象,在该对象中构造函数还没有运行。事实上,清单 11 包含展现这种状况发生的代码。注意,这个代码仅在我测试用的旧版 JVM 上会失败。IBM 1.3 和 Sun 1.3 JVM 都会如期生成不变的 String。

清单 11. 可变 String 的例子

复制代码

class StringCreator extends Thread
{
MutableString ms;
public StringCreator(MutableString muts)
{
ms = muts;
}
public void run()
{
while(true)
ms.str = new String("hello"); //1
}
}
class StringReader extends Thread
{
MutableString ms;
public StringReader(MutableString muts)
{
ms = muts;
}
public void run()
{
while(true)
{
if (!(ms.str.equals("hello"))) //2
{
System.out.println("String is not immutable!");
break;
}
}
}
}
class MutableString
{
public String str; //3
public static void main(String args[])
{
MutableString ms = new MutableString(); //4
new StringCreator(ms).start(); //5
new StringReader(ms).start(); //6
}
}
复制代码

此代码在 //4 处建立一个 MutableString 类,它包含了一个 String 引用,此引用由 //3 处的两个线程共享。在行 //5 和 //6 处,在两个分开的线程上建立了两个对象 StringCreator 和 StringReader。传入一个 MutableString 对象的引用。StringCreator 类进入到一个无限循环中而且使用值“hello”在 //1 处建立 String 对象。StringReader 也进入到一个无限循环中,而且在 //2 处检查当前的 String 对象的值是否是 “hello”。若是不行,StringReader 线程打印出一条消息并中止。若是 String 类是不变的,则今后程序应当看不到任何输出。若是发生了无序写入问题,则使 StringReader 看到 str 引用的唯一方法毫不是值为“hello”的 String 对象。

在旧版的 JVM 如 Sun JDK 1.2.1 上运行此代码会致使无序写入问题。并所以致使一个非不变的 String。

结束语
为避免单例中代价高昂的同步,程序员很是聪明地发明了双重检查锁定习语。不幸的是,鉴于当前的内存模型的缘由,该习语还没有获得普遍使用,就明显成为了一种不安全的编程结构。重定义脆弱的内存模型这一领域的工做正在进行中。尽管如此,即便是在新提议的内存模型中,双重检查锁定也是无效的。对此问题最佳的解决方案是接受同步或者使用一个 static field。(这边解释一下:这篇长篇大论想阐述的观点就是:若是在使用单例设计模式的时候要保证线程的安全不是使用双重检测锁,而是使用单例设计模式中的饿汉子式单例,但其实清单2也能够实现只是形成了性能消耗)

参考资料

您能够参阅本文在 developerWorks 全球网站上的 英文原文。

在 Peter Haggar 的书 Practical Java Programming Language Guide (Addison-Wesley,2000 年)中,他介绍了多个 Java 编程主题,包括了一整章关于多线程问题和编程技术的内容。

Bill Joy 等人编写的 The Java Language Specification, Second Edition (Addison-Wesley,2000 年)是 Java 编程语言方面的权威性技术参考。

由 Tim Lindholm 和 Frank Yellin 合写的 The Java Virtual Machine Specification, Second Edition (Addison-Wesley,1999 年)是关于 Java 编译器和运行时环境的权威性文档。

访问 Bill Pugh 的 Java Memory Model Web 站点,获取大量关于此主题的信息。

要了解更多关于 volatile 和 64 位变量的信息,请参阅 Peter Haggar 的文章“Does Java Guarantee Thread Safety?”,发表在 2002 年 6 月那期的 Dr. Dobb's Journal 之上。

JSR-133 处理对 Java 平台的内存模型和线程规范的修订。

Java 软件顾问 Brian Goetz 在“轻松使用线程:同步不是敌人”(developerWorks,2001 年 7 月)中介绍了什么时候使用同步。

在“轻松使用线程:不共享有时是最好的”(developerWorks,2001 年 10 月)中,Brian Goetz 介绍了 ThreadLocal,并提供了一些发掘它的能力的小提示。

在“轻松使用线程:同步不是敌人”(developerWorks,2001 年 2 月)中,Alex Roetter 引入 Java Thread API,概述了与多线程相关的问题,并提供了常见问题的解决方案。

Allen Holub 在“若是我是国王:关于解决 Java编程语言线程问题的建议”(developerWorks,2000 年 10 月)中建议对 Java 语言做出重大的改变和添加。

在 developerWorks Java 技术专区 查找其余的 Java 技术资料。

相关文章
相关标签/搜索