Java虚拟机09——线程安全与锁优化

时间 2019-11-09

标签 java 虚拟机线程安全优化栏目 Java 繁體版

原文原文链接

线程安全

线程安全：当多个线程访问一个对象时，若是不用考虑这些线程在运行时环境下的调度和交替执行，也不须要进行额外的同步，或者在调用方进行任何其余的协调操做，调用这个对象的行为均可以得到正确的结果，那这个对象是线程安全的。java

java语言中的线程安全

Java语言中各类操做共享的数据分为如下5类：不可变、绝对线程安全、相对线程安全、线程兼容和线程对立安全

不可变（Immutable）

不可变对象必定是线程安全的，不管是对象的方法实现仍是方法的调用者，都不须要再采起任何的线程安全保障措施。只要一个不可变对象被正确地构建出来（没有发生this逃逸的状况），那其外部的可见状态永远也不会改变，永远也不会看到它在多个线程之中处于不一致的状态。Java中常见的不可变对象有String，java.lang.Number及部分子类（Long、Double和BigDecimal）等多线程

绝对线程安全

绝对线程安全：一个类无论运行时环境如何，调用者都不须要任何额外的同步措施。在JavaAPI中，标注本身是线程安全的类，大多数都不是绝对的线程安全。并发

java.util.Vector是一个线程安全的容器，由于它的add()、get()和size()这类方法都是被synchronized修饰的，尽管这样效率很低，但确实是安全的。可是，即便它全部的方法都被修饰成同步，也不意味着调用它的时候永远都再也不须要同步手段了。以下代码：函数

public class VectorTest {
    private static Vector<Integer> vector = new Vector<>();

    public static void main(String[] args) {
        while(true) {
            for (int i = 0; i < 10; i++) {
                vector.add(i);
            }

            Thread removeThread = new Thread(()-> {
                // 让线程稍微停顿一会
                try {
                    Thread.sleep(10);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                for (int i = 0; i <vector.size() ; i++) {
                    vector.remove(i);
                }
            });

            Thread printThread = new Thread(()-> {
                for (int i = 0; i < vector.size(); i++) {
                    System.out.println(vector.get(i));
                }
            });

            removeThread.start();
            printThread.start();

        }
    }
}

复制代码

结果以下：性能

若是另外一个线程在错误的时间里删除了一个元素，致使序号i已经再也不可用了，再用i访问就会抛出ArrayIndexOutOfBoundsException。所以，咱们不得不须要在方法调用端作额外的同步操做，如：

Thread removeThread = new Thread(()-> {
                // 让线程稍微停顿一会
                try {
                    Thread.sleep(10);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                synchronized (vector) {
                    for (int i = 0; i <vector.size() ; i++) {
                        vector.remove(i);
                    }
                }

            });

            Thread printThread = new Thread(()-> {
                synchronized (vector) {
                    for (int i = 0; i < vector.size(); i++) {
                        System.out.println(vector.get(i));
                    }
                }

            });

复制代码

相对线程安全

相对的线程安全就是咱们一般意义上讲的线程安全。它须要保证这个对象单独的操做是线程安全的，咱们在调用的时候不须要作额外的保障措施，可是对于一些特定顺序的连续调用，就可能须要在调用端使用额外的同步手段来保证调用的正确性，如上例。在Java中，大部分安全类都属于这种类型，如Vector、HashTable、Collections的synchronizedCollection()方法包装的集合等。测试

线程兼容

线程兼容是指对象自己并非线程安全的，可是能够经过在调用端正确地使用同步手段来保证对象在并发环境中能够安全地使用，咱们日常说一个类不是线程安全的，绝大多数时候指的是这一种状况。Java API中大部分的类都是属于线程兼容的，如集合类ArrayList和HashMap等。优化

线程对立

线程对立是指不管调用端是否采起了同步措施，都没法在多线程环境中并发使用的代码。this

一个线程对立的例子是Thread类的suspend()和resume()方法，若是有两个线程同时持有一个线程对象，一个尝试去中断线程，另外一个尝试去恢复线程，若是并发进行的话，不管调用时是否进行了同步，目标线程都是存在死锁风险的，若是suspend()中断的线程就是即将要执行resume()的那个线程，那就确定要产生死锁了。也正是因为这个缘由，suspend()和resume()方法已经被JDK声明废弃（@Deprecated）了。常见的线程对立的操做还有System.setIn()、Sytem.setOut()和System.runFinalizersOnExit()等。spa

线程安全的实现方法

互斥同步

互斥同步（Mutual Exclusion & Synchronization）,同步时指在多个线程并发访问共享数据时，保证共享数据在同一时刻只被一个（或者是一些，使用信号量的时候）线程使用。而互斥是实现同步的一种手段，临界区（Critical Section）、互斥量（Mutex）和信号量（Semaphore）都是主要的互斥实现方式。互斥是因，同步是果；互斥是方法，同步是目的。

在Java中，最基本的互斥同步手段就是synchronized关键字，synchronized关键字通过编译以后，会在同步块的先后分别造成monitorenter和monitorexit这两个字节码指令，这两个字节码都须要一个reference类型的参数来指明要锁定和解锁的对象。若是Java程序中的synchronized明确指定了对象参数，那就是这个对象的reference；若是没有明确指定，那就根据synchronized修饰的是实例方法仍是类方法，去取对应的对象实例或Class对象来做为锁对象。

根据虚拟机规范的要求，在执行monitorenter时，首先要尝试获取对象的锁。若是这个对象没有被锁定，或者当前线程已经拥有了那个对象的锁，把锁的计数器加1，相应的。在执行monitoerexit指令时将会将锁的计数器减1，当计数器为0时，锁就被释放。若是获取对象锁失败，那当前线程就要阻塞等待，直到对象锁被另外一个线程释放为止。

在虚拟机规范对monitorenter和monitorexit的行为描述中，有两点是须要特别注意的。首先，synchronized同步块对同一条线程来讲是可重入的，不会出现本身把本身锁死的问题。其次，同步块在已进入的线程执行完以前，会阻塞后面其余线程的进入。Java的线程是映射到操做系统的原生线程之上的，若是要阻塞或唤醒一个线程，都须要操做系统来帮忙完成，这就须要从用户态转换到核心态中，所以状态转换须要耗费不少的处理器时间。因此synchronized是Java语言中一个重量级（Heavyweight）的操做。虚拟机自己也会进行一些优化，譬如在通知操做系统阻塞线程以前加入一段自旋等待过程，避免频繁地切入到核心态之中。

除了synchronized以外，咱们还可使用java.util.concurrent(下文称JUC)包中的重入锁（ReentrantLock）来实现同步，他们都具有同样的线程重入特性，只是代码写法上有点区别，一个表现为API层面的互斥锁（lock()和unlock()方法配合try/finally语句块来完成），另外一个表现为原生语法层面的互斥锁。相比synchronized，ReentrantLock增长了一些高级功能，主要有如下3项：等待可中断、可实现公平锁，以及锁能够绑定多个条件。

等待可中断是指当持有锁的线程长期不释放锁的时候，正在等待的线程能够选择放弃等待，改成处理其余事情。可中断特性对处理执行时间很是长的同步块颇有帮助。
公平锁是指多个线程在等待同一个锁时，必须按照申请锁的时间顺序来依次得到锁；而非公平锁则不保证这一点，在锁被释放时，任何一个等待锁的线程都有机会得到锁。synchronized中的锁是非公平的，ReentrantLock默认状况下也是非公平的，但能够经过带布尔值的构造函数要求使用公平锁。
锁绑定多个条件是指一个ReentrantLock对象能够同时绑定多个Condition对象，而在synchronized中，锁对象的wait（）和notify（）或notifyAll（）方法能够实现一个隐含的条件，若是要和多于一个的条件关联的时候，就不得不额外地添加一个锁，而ReentrantLock则无须这样作，只须要屡次调用newCondition（）方法便可。

非阻塞同步

互斥同步最主要的问题就是进行线程阻塞和唤醒所带来的性能问题，所以这种同步也称为阻塞同步（Blocking Synchronization）。从处理问题的方式上说，互斥同步属于一种悲观的并发策略，老是认为只要不去作正确的同步措施（例如加锁），那就确定会出现问题，不管共享数据是否真的会出现竞争，它都要进行加锁（这里讨论的是概念模型，实际上虚拟机会优化掉很大一部分没必要要的加锁）、用户态核心态转换、维护锁计数器和检查是否有被阻塞的线程须要唤醒等操做。

随着硬件指令集的发展，咱们有了另一个选择：基于冲突检测的乐观并发策略，通俗地说，就是先进行操做，若是没有其余线程争用共享数据，那操做就成功了；若是共享数据有争用，产生了冲突，那就再采起其余的补偿措施（最多见的补偿措施就是不断地重试，直到成功为止），这种乐观的并发策略的许多实现都不须要把线程挂起，所以这种同步操做称为非阻塞同步（Non-Blocking Synchronization）。

非阻塞同步通常经过硬件来保证一个从语义上看起来须要屡次操做的行为只经过一条处理器指令就能完成，这类指令经常使用的有：

测试并设置（Test-and-Set）。
获取并增长（Fetch-and-Increment）。
交换（Swap）。
比较并交换（Compare-and-Swap，下文称CAS）。
加载连接/条件存储（Load-Linked/Store-Conditional，下文称LL/SC）。

CAS指令须要有3个操做数，分别是内存位置（在Java中能够简单理解为变量的内存地址，用V表示）、旧的预期值（用A表示）和新值（用B表示）。CAS指令执行时，当且仅当V符合旧预期值A时，处理器用新值B更新V的值，不然它就不执行更新，可是不管是否更新了V的值，都会返回V的旧值，上述的处理过程是一个原子操做。

在JDK 1.5以后，Java程序中才可使用CAS操做，该操做由sun.misc.Unsafe类里面的compareAndSwapInt()和compareAndSwapLong()等几个方法包装提供，虚拟机在内部对这些方法作了特殊处理，即时编译出来的结果就是一条平台相关的处理器CAS指令，没有方法调用的过程，或者能够认为是无条件内联进去了。

因为Unsafe类不是提供给用户程序调用的类（Unsafe.getUnsafe()的代码中限制了只有启动类加载器（Bootstrap ClassLoader）加载的Class才能访问它），所以，若是不采用反射手段，咱们只能经过其余的Java API来间接使用它，如J.U.C包里面的整数原子类，其中的compareAndSet()和getAndIncrement()等方法都使用了Unsafe类的CAS操做。下面看看如何使用CAS来避免阻塞操做：

public class VolatileTest {
    public static volatile AtomicInteger race = new AtomicInteger(0);

    public static void increase() {
        race.incrementAndGet();
    }

    private static final int THREADS_COUNT = 20;

    public static void main(String[] args) {
        Thread[] threads = new Thread[THREADS_COUNT];
        for (int i = 0; i < THREADS_COUNT; i++) {
            threads[i] = new Thread(() -> {
                for (int j = 0; j < 10000; j++) {
                    increase();
                }
            });
            threads[i].start();
        }
        // 等待全部累加线程都结束
        while (Thread.activeCount()>1) {
            Thread.yield();
        }
        System.out.println(race);
    }

}

复制代码

运行结果以下： 200000 这一切都要归功于incrementAndGet()方法的原子性，其源码(JDK1.7)以下：

public final int incrementAndGet() {
    for (;;) {
        int current = get();
        int next = current + 1;
        if (compareAndSet(current, next))
            return next;
    }
}
复制代码

incrementAndGet()方法在一个无限循环中，不断尝试将一个比当前值大1的新值赋给本身。若是失败了，那说明在执行“获取-位置”的时候值已经有了修改，因而再次循环进行下一次操做，知道设置成功为止。

CAS这种操做没法涵盖互斥同步的全部使用场景，而且CAS从语义上来讲并非完美的，存在这样的一个逻辑漏洞：若是一个变量V初次读取的时候是A值，而且在准备赋值的时候检查到它仍然为A值，那咱们就能说它的值没有被其余线程改变过了吗？若是在这段期间它的值曾经被改为了B，后来又被改回为A，那CAS操做就会误认为它历来没有被改变过。这个漏洞称为CAS操做的“ABA”问题。JUC包为了解决这个问题，提供了一个带有标记的原子引用类AtomicStampedReference，它能够经过控制变量值的版原本保证CAS的正确性。大部分状况下ABA问题不会影响程序并发的正确性，若是须要解决ABA问题，改用传统的互斥同步可能会比原子类更高效。

无同步方案

要保证线程安全，并非必定就要进行同步，二者没有因果关系。同步只是保证共享数据争用时的正确性的手段，若是一个方法原本就不涉及共享数据，那它天然就无须任何同步措施去保证正确性，所以会有一些代码天生就是线程安全的，笔者简单地介绍其中的两类。

可重入代码（Reentrant Code）

这种代码也叫作纯代码（Pure Code），能够在代码执行的任什么时候刻中断它，转而去执行另一段代码（包括递归调用它自己），而在控制权返回后，原来的程序不会出现任何错误。相对线程安全来讲，可重入性是更基本的特性，它能够保证线程安全，即全部的可重入的代码都是线程安全的，可是并不是全部的线程安全的代码都是可重入的。

可重入代码有一些共同的特征，例如不依赖存储在堆上的数据和公用的系统资源、用到的状态量都由参数中传入、不调用非可重入的方法等。咱们能够“经过一个简单的原则来判断代码是否具有可重入性：若是一个方法，它的返回结果是能够预测的，只要输入了相同的数据，就都能返回相同的结果，那它就知足可重入性的要求，固然也就是线程安全的。

线程本地存储（Thread Local Storage）

若是一段代码中所须要的数据必须与其余代码共享，那就看看这些共享数据的代码是否能保证在同一个线程中执行？若是能保证，咱们就能够把共享数据的可见范围限制在同一个线程以内，这样，无须同步也能保证线程之间不出现数据争用的问题。

Java语言中，若是一个变量要被多线程访问，可使用volatile关键字声明它为“易变的”；若是一个变量要被某个线程独享，能够经过java.lang.ThreadLocal类来实现线程本地存储的功能。每个线程的Thread对象中都有一个ThreadLocalMap对象，这个对象存储了一组以ThreadLocal.threadLocalHashCode为键，以本地线程变量为值的键值对，ThreadLocal对象就是当前线程的ThreadLocalMap的访问入口，每个ThreadLocal对象都包含了一个独一无二的threadLocalHashCode值，使用这个值就能够在线程键值值对中找回对应的本地线程变量。

锁优化

为了在线程之间更高效地共享数据，以及解决竞争问题，从而提升程序的执行效率，HotSpot虚拟机开发团队实现了锁优化技术，如适应性自旋（Adaptive Spinning）、锁消除（Lock Elimination）、锁粗化（Lock Coarsening）、轻量级锁（Lightweight Locking）和偏向锁（Biased Locking）等。

自旋锁于自适应锁

互斥同步对性能最大的影响是阻塞的实现，挂起线程和恢复线程的操做都须要转入内核态中完成，这些操做给系统的并发性能带来了很大的压力。在许多应用上，共享数据的锁定状态只会持续很短的一段时间，为了这段时间去挂起和恢复线程并不值得。若是物理机器有一个以上的处理器，能让两个或以上的线程同时并行执行，咱们就可让后面请求锁的那个线程“稍等一下”，但不放弃处理器的执行时间，看看持有锁的线程是否很快就会释放锁。为了让线程等待，咱们只需让线程执行一个忙循环（自旋），这项技术就是所谓的自旋锁。

自旋锁在JDK 1.4.2中就已经引入，只不过默认是关闭的，可使用-XX:+UseSpinning参数来开启，在JDK 1.6中就已经改成默认开启了。自旋等待不能代替阻塞，且先不说对处理器数量的要求，自旋等待自己虽然避免了线程切换的开销，但它是要占用处理器时间的，所以，若是锁被占用的时间很短，自旋等待的效果就会很是好，反之，若是锁被占用的时间很长，那么自旋的线程只会白白消耗处理器资源，而不会作任何有用的工做，反而会带来性能上的浪费。所以，自旋等待的时间必需要有必定的限度，若是自旋超过了限定的次数仍然没有成功得到锁，就应当使用传统的方式去挂起线程了。自旋次数的默认值是10次，用户可使用参数-XX:PreBlockSpin来更改。

在JDK 1.6中引入了自适应的自旋锁。自适应意味着自旋的时间再也不固定了，而是由前一次在同一个锁上的自旋时间及锁的拥有者的状态来决定。若是在同一个锁对象上，自旋等待刚刚成功得到过锁，而且持有锁的线程正在运行中，那么虚拟机就会认为此次自旋也颇有可能再次成功，进而它将容许自旋等待持续相对更长的时间。另外，若是对于某个锁，自旋不多成功得到过，那在之后要获取这个锁时将可能省略掉自旋过程，以免浪费处理器资源。有了自适应自旋，随着程序运行和性能监控信息的不断完善，虚拟机对程序锁的情况预测就会愈来愈准确。

锁消除

锁消除是指虚拟机即时编译器在运行时，对一些代码上要求同步，可是被检测到不可能存在共享数据竞争的锁进行消除。锁消除的主要断定依据来源于逃逸分析的数据支持，若是判断在一段代码中，堆上的全部数据都不会逃逸出去从而被其余线程访问到，那就能够把它们当作栈上数据对待，认为它们是线程私有的，同步加锁天然就无须进行。

锁粗化

原则上，咱们在编写代码的时候，老是推荐将同步块的做用范围限制得尽可能小——只在共享数据的实际做用域中才进行同步，这样是为了使得须要同步的操做数量尽量变小，若是存在锁竞争，那等待锁的线程也能尽快拿到锁。

大部分状况下，上面的原则都是正确的，可是若是一系列的连续操做都对同一个对象反复加锁和解锁，甚至加锁操做是出如今循环体中的，那即便没有线程竞争，频繁地进行互斥同步操做也会致使没必要要的性能损耗。

若是虚拟机探测到一串零碎的操做都对同一个对象加锁，将会把加锁同步的范围扩展（粗化）到整个操做序列的外部。

轻量级锁

轻量级锁是JDK 1.6之中加入的新型锁机制，它名字中的“轻量级”是相对于使用操做系统互斥量来实现的传统锁而言的，所以传统的锁机制就称为“重量级”锁。轻量级锁用于在没有多线程竞争的前提下，减小传统的重量级锁使用操做系统互斥量产生的性能消耗。

轻量级锁能提高程序同步性能的依据是“对于绝大部分的锁，在整个同步周期内都是不存在竞争的”，这是一个经验数据。若是没有竞争，轻量级锁使用CAS操做避免了使用互斥量的开销，但若是存在锁竞争，除了互斥量的开销外，还额外发生了CAS操做，所以在有竞争的状况下，轻量级锁会比传统的重量级锁更慢。

偏向锁

偏向锁也是JDK 1.6中引入的一项锁优化，它的目的是消除数据在无竞争状况下的同步原语，进一步提升程序的运行性能。若是说轻量级锁是在无竞争的状况下使用CAS操做去消除同步使用的互斥量，那偏向锁就是在无竞争的状况下把整个同步都消除掉，连CAS操做都不作了。

偏向锁的“偏”，就是偏爱的“偏”、偏袒的“偏”，它的意思是这个锁会偏向于第一个得到它的线程，若是在接下来的执行过程当中，该锁没有被其余的线程获取，则持有偏向锁的线程将永远不须要再进行同步。

偏向锁能够提升带有同步但无竞争的程序性能。它一样是一个带有效益权衡（Trade Off）性质的优化，也就是说，它并不必定老是对程序运行有利，若是程序中大多数的锁老是被多个不一样的线程访问，那偏向模式就是多余的。在具体问题具体分析的前提下，有时候使用参数-XX:-UseBiasedLocking来禁止偏向锁优化反而能够提高性能。