Java线程安全队列Queue实现原理

时间 2020-08-01

标签 java 线程安全队列 queue 实现原理栏目 Java 繁體版

原文原文链接

原文连接:https://www.cnblogs.com/DreamRecorder/p/9223016.htmlhtml

在Java多线程应用中，队列的使用率很高，多数生产消费模型的首选数据结构就是队列。Java提供的线程安全的Queue能够分为阻塞队列和非阻塞队列，其中阻塞队列的典型例子是BlockingQueue，非阻塞队列的典型例子是ConcurrentLinkedQueue，在实际应用中要根据实际须要选用阻塞队列或者非阻塞队列。
注：什么叫线程安全？这个首先要明确。线程安全的类，指的是类内共享的全局变量的访问必须保证是不受多线程形式影响的。若是因为多线程的访问（好比修改、遍历、查看）而使这些变量结构被破坏或者针对这些变量操做的原子性被破坏，则这个类就不是线程安全的。
今天就聊聊这两种Queue，本文分为如下两个部分，用分割线分开： java

　　BlockingQueue 阻塞算法算法

　　ConcurrentLinkedQueue，非阻塞算法安全

　　首先来看看BlockingQueue：数据结构

　　Queue是什么就不须要多说了吧，一句话：队列是先进先出。相对的，栈是后进先出。若是不熟悉的话先找本基础的数据结构的书看看吧。多线程

　　BlockingQueue，顾名思义，“阻塞队列”：能够提供阻塞功能的队列。并发

　　首先，看看BlockingQueue提供的经常使用方法：异步

	可能报异常	返回布尔值	可能阻塞	设定等待时间
入队	add(e)	offer(e)	put(e)	offer(e, timeout, unit)
出队	remove()	poll()	take()	poll(timeout, unit)
查看	element()	peek()	无	无

从上表能够很明显看出每一个方法的做用，这个不用多说。我想说的是：函数

add(e) remove() element() 方法不会阻塞线程。当不知足约束条件时，会抛出IllegalStateException 异常。例如：当队列被元素填满后，再调用add(e)，则会抛出异常。
ffer(e) poll() peek() 方法即不会阻塞线程，也不会抛出异常。例如：当队列被元素填满后，再调用offer(e)，则不会插入元素，函数返回false。
要想要实现阻塞功能，须要调用put(e) take() 方法。当不知足约束条件时，会阻塞线程。

好了，上点源码你就更明白了。以ArrayBlockingQueue类为例，对于第一类方法，很明显若是操做不成功就抛异常。并且能够看到其实调用的是第二类的方法，为何？由于第二类方法返回boolean啊。性能

public boolean add(E e) {
    if (offer(e))
        return true;
    else
        throw new IllegalStateException("Queue full");//队列已满，抛异常
}

public E remove() {
    E x = poll();
    if (x != null)
        return x;
    else
        throw new NoSuchElementException();//队列为空，抛异常
}

对于第二类方法，很标准的ReentrantLock使用方式，另外对于insert和extract的实现没啥好说的。

　　注：先不看阻塞与否，这ReentrantLock的使用方式就能说明这个类是线程安全类。

public boolean offer(E e) {
    if (e == null) throw new NullPointerException();
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        if (count == items.length)//队列已满，返回false
            return false;
        else {
            insert(e);//insert方法中发出了notEmpty.signal();
            return true;
        }
    } finally {
        lock.unlock();
    }
}

public E poll() {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        if (count == 0)//队列为空，返回false
            return null;
        E x = extract();//extract方法中发出了notFull.signal();
        return x;
    } finally {
        lock.unlock();
    }
}

对于第三类方法，这里面涉及到Condition类，简要提一下，await方法指：形成当前线程在接到信号或被中断以前一直处于等待状态。signal方法指：唤醒一个等待线程。

1 public void put(E e)throws InterruptedException {
 2 if (e == null)throw new NullPointerException();
 3 final E[] items = this.items;
 4 final ReentrantLock lock = this.lock;
 5 lock.lockInterruptibly();
 6 try {
 7 try {
 8 while (count == items.length)//若是队列已满，等待notFull这个条件，这时当前线程被阻塞
 9 notFull.await();
10 } catch (InterruptedException ie) {
11 notFull.signal(); //唤醒受notFull阻塞的当前线程
12 throw ie;
13 }
14 insert(e);
15 } finally {
16 lock.unlock();
17 }
18 }
19 public E take() throws InterruptedException {
20 final ReentrantLock lock = this.lock;
21 lock.lockInterruptibly();
22 try {
23 try {
24 while (count == 0)//若是队列为空，等待notEmpty这个条件，这时当前线程被阻塞
25 notEmpty.await();
26 } catch (InterruptedException ie) {
27 notEmpty.signal();//唤醒受notEmpty阻塞的当前线程
28 throw ie;
29 }
30 E x = extract();
31 return x;
32 } finally {
33 lock.unlock();
34 }
35 }
36

第四类方法就是指在有必要时等待指定时间，就不详细说了。再来看看BlockingQueue接口的具体实现类吧：

ArrayBlockingQueue，其构造函数必须带一个int参数来指明其大小
LinkedBlockingQueue，若其构造函数带一个规定大小的参数，生成的BlockingQueue有大小限制，若不带大小参数，所生成的BlockingQueue的大小由Integer.MAX_VALUE来决定
PriorityBlockingQueue，其所含对象的排序不是FIFO,而是依据对象的天然排序顺序或者是构造函数的Comparator决定的顺序

上面是用ArrayBlockingQueue举得例子，下面看看LinkedBlockingQueue：
　　首先，既然是链表，就应该有Node节点，它是一个内部静态类：

1 static class Node<E> {
2 /** The item, volatile to ensure barrier separating write and read */
3 volatile E item;
4 Node<E> next;
5 Node(E x) { item = x; }
6 }

而后，对于链表来讲，确定须要两个变量来标示头和尾：

1 /** 头指针 */
2 private transient Node<E> head;//head.next是队列的头元素
3 /** 尾指针 */
4 private transient Node<E> last;//last.next是null

　　那么，对于入队和出队就很天然能理解了：

1 private void enqueue(E x) {
 2 last = last.next = new Node<E>(x);//入队是为last再找个下家
 3 }
 4 private E dequeue() {
 5 Node<E> first = head.next; //出队是把head.next取出来，而后将head向后移一位
 6 head = first;
 7 E x = first.item;
 8 first.item = null;
 9 return x;
10 }

　　另外，LinkedBlockingQueue相对于ArrayBlockingQueue还有不一样是，有两个ReentrantLock，且队列现有元素的大小由一个AtomicInteger对象标示。注：AtomicInteger类是以原子的方式操做整型变量。

1 private final AtomicInteger count =new AtomicInteger(0);
2 /** 用于读取的独占锁*/
3 private final ReentrantLock takeLock =new ReentrantLock();
4 /** 队列是否为空的条件 */
5 private final Condition notEmpty = takeLock.newCondition();
6 /** 用于写入的独占锁 */
7 private final ReentrantLock putLock =new ReentrantLock();
8 /** 队列是否已满的条件 */
9 private final Condition notFull = putLock.newCondition();

　　有两个Condition很好理解，在ArrayBlockingQueue也是这样作的。可是为何须要两个ReentrantLock呢？下面会慢慢道来。

　　让咱们来看看offer和poll方法的代码：

1 public boolean offer(E e) {
 2 if (e == null)throw new NullPointerException();
 3 final AtomicInteger count = this.count;
 4 if (count.get() == capacity)
 5 return false;
 6 int c = -1;
 7 final ReentrantLock putLock =this.putLock;//入队固然用putLock
 8 putLock.lock();
 9 try {
10 if (count.get() < capacity) {
11 enqueue(e); //入队
12 c = count.getAndIncrement(); //队长度+1
13 if (c + 1 < capacity)
14 notFull.signal(); //队列没满，固然能够解锁了
15 }
16 } finally {
17 putLock.unlock();
18 }
19 if (c == 0)
20 signalNotEmpty();//这个方法里发出了notEmpty.signal();
21 return c >= 0;
22 }
23 public E poll() {
24 final AtomicInteger count = this.count;
25 if (count.get() == 0)
26 return null;
27 E x = null;
28 int c = -1;
29 final ReentrantLock takeLock =this.takeLock;出队固然用takeLock
30 takeLock.lock();
31 try {
32 if (count.get() > 0) {
33 x = dequeue();//出队
34 c = count.getAndDecrement();//队长度-1
35 if (c > 1)
36 notEmpty.signal();//队列没空，解锁
37 }
38 } finally {
39 takeLock.unlock();
40 }
41 if (c == capacity)
42 signalNotFull();//这个方法里发出了notFull.signal();
43 return x;
44 }

　　看看源代码发现和上面ArrayBlockingQueue的很相似，关键的问题在于：为何要用两个ReentrantLockputLock和takeLock？

　　咱们仔细想一下，入队操做其实操做的只有队尾引用last，而且没有牵涉到head。而出队操做其实只针对head，和last没有关系。那么就是说入队和出队的操做彻底不须要公用一把锁，因此就设计了两个锁，这样就实现了多个不一样任务的线程入队的同时能够进行出队的操做，另外一方面因为两个操做所共同使用的count是AtomicInteger类型的，因此彻底不用考虑计数器递增递减的问题。
　　另外，还有一点须要说明一下：await()和singal()这两个方法执行时都会检查当前线程是不是独占锁的当前线程，若是不是则抛出java.lang.IllegalMonitorStateException异常。因此能够看到在源码中这两个方法都出如今Lock的保护块中。

-------------------------------我是分割线--------------------------------------

　　下面再来讲说ConcurrentLinkedQueue，它是一个无锁的并发线程安全的队列。
　　如下部分的内容参照了这个帖子http://yanxuxin.iteye.com/blog/586943
　　对比锁机制的实现，使用无锁机制的难点在于要充分考虑线程间的协调。简单的说就是多个线程对内部数据结构进行访问时，若是其中一个线程执行的中途由于一些缘由出现故障，其余的线程可以检测并帮助完成剩下的操做。这就须要把对数据结构的操做过程精细的划分红多个状态或阶段，考虑每一个阶段或状态多线程访问会出现的状况。
　　ConcurrentLinkedQueue有两个volatile的线程共享变量：head，tail。要保证这个队列的线程安全就是保证对这两个Node的引用的访问（更新，查看）的原子性和可见性，因为volatile自己可以保证可见性，因此就是对其修改的原子性要被保证。
　　下面经过offer方法的实现来看看在无锁状况下如何保证原子性：

1 public boolean offer(E e) {
 2 if (e == null)throw new NullPointerException();
 3 Node<E> n = new Node<E>(e, null);
 4 for (;;) {
 5 Node<E> t = tail;
 6 Node<E> s = t.getNext();
 7 if (t == tail) { //------------------------------a
 8 if (s == null) {//---------------------------b
 9 if (t.casNext(s, n)) { //-------------------c
10 casTail(t, n); //------------------------d
11 return true;
12 }
13 } else {
14 casTail(t, s); //----------------------------e
15 }
16 }
17 }
18 }

此方法的循环内首先得到尾指针和其next指向的对象，因为tail和Node的next均是volatile的，因此保证了得到的分别都是最新的值。

　　代码a：t==tail是最上层的协调，若是其余线程改变了tail的引用，则说明如今得到不是最新的尾指针须要从新循环得到最新的值。

　　代码b：s==null的判断。静止状态下tail的next必定是指向null的，可是多线程下的另外一个状态就是中间态：tail的指向没有改变，可是其next已经指向新的结点，即完成tail引用改变前的状态，这时候s!=null。这里就是协调的典型应用，直接进入代码e去协调参与中间态的线程去完成最后的更新，而后从新循环得到新的tail开始本身的新一次的入队尝试。另外值得注意的是a,b之间，其余的线程可能会改变tail的指向，使得协调的操做失败。从这个步骤能够看到无锁实现的复杂性。

　　代码c：t.casNext(s, n)是入队的第一步，由于入队须要两步：更新Node的next，改变tail的指向。代码c以前可能发生tail引用指向的改变或者进入更新的中间态，这两种状况均会使得t指向的元素的next属性被原子的改变，再也不指向null。这时代码c操做失败，从新进入循环。

　　代码d：这是完成更新的最后一步了，就是更新tail的指向，最有意思的协调在这儿又有了体现。从代码看casTail(t, n)不论是否成功都会接着返回true标志着更新的成功。首先若是成功则代表本线程完成了两步的更新，返回true是理所固然的；若是 casTail(t, n)不成功呢？要清楚的是完成代码c则表明着更新进入了中间态，代码d不成功则是tail的指向被其余线程改变。意味着对于其余的线程而言：它们获得的是中间态的更新，s!=null，进入代码e帮助本线程执行最后一步而且先于本线程成功。这样本线程虽然代码d失败了，可是是因为别的线程的协助先完成了，因此返回true也就理所固然了。
　　经过分析这个入队的操做，能够清晰的看到无锁实现的每一个步骤和状态下多线程之间的协调和工做。
　　注：上面这大段文字看起来很累，先能看懂多少看懂多少，如今看不懂先不急，下面还会提到这个算法，而且用示意图说明，就易懂不少了。

在使用ConcurrentLinkedQueue时要注意，若是直接使用它提供的函数，好比add或者poll方法，这样咱们本身不须要作任何同步。
　　但若是是非原子操做，好比：

1  if(!queue.isEmpty()) { 
2 queue.poll(obj); 
3 }

　　咱们很难保证，在调用了isEmpty()以后，poll()以前，这个queue没有被其余线程修改。因此对于这种状况，咱们仍是须要本身同步：

1 synchronized(queue) {
2 if(!queue.isEmpty()) {
3 queue.poll(obj);
4 }
5 }

注：这种须要进行本身同步的状况要视状况而定，不是任何状况下都须要这样作。
另外还说一下，ConcurrentLinkedQueue的size()是要遍历一遍集合的，因此尽可能要避免用size而改用isEmpty()，以避免性能过慢。
最后想说点什么呢，阻塞算法其实很好理解，简单点理解就是加锁，好比在BlockingQueue中看到的那样，再往前推点，那就是synchronized。相比而言，非阻塞算法的设计和实现都很困难，要经过低级的原子性来支持并发。下面就简要的介绍一下非阻塞算法，如下部分的内容参照了一篇很经典的文章http://www.ibm.com/developerworks/cn/java/j-jtp04186/
注：我以为能够这样理解，阻塞对应同步，非阻塞对应并发。也能够说：同步是阻塞模式，异步是非阻塞模式

举个例子来讲明什么是非阻塞算法：非阻塞的计数器
首先，使用同步的线程安全的计数器代码以下

public finalclass Counter { private long value =0; public synchronizedlong getValue() { return value; } public synchronizedlong increment() { return ++value; } }

　　下面的代码显示了一种最简单的非阻塞算法：使用 AtomicInteger的compareAndSet()（CAS方法）的计数器。compareAndSet()方法规定“将这个变量更新为新值，可是若是从我上次看到这个变量以后其余线程修改了它的值，那么更新就失败”

public class NonblockingCounter { private AtomicInteger value;//前面提到过，AtomicInteger类是以原子的方式操做整型变量。
public int getValue() { return value.get(); } public int increment() { int v; do { v = value.get(); while (!value.compareAndSet(v, v +1)); return v + 1; } }

非阻塞版本相对于基于锁的版本有几个性能优点。首先，它用硬件的原生形态代替 JVM 的锁定代码路径，从而在更细的粒度层次上（独立的内存位置）进行同步，失败的线程也能够当即重试，而不会被挂起后从新调度。更细的粒度下降了争用的机会，不用从新调度就能重试的能力也下降了争用的成本。即便有少许失败的 CAS 操做，这种方法仍然会比因为锁争用形成的从新调度快得多。

NonblockingCounter 这个示例可能简单了些，可是它演示了全部非阻塞算法的一个基本特征——有些算法步骤的执行是要冒险的，由于知道若是 CAS 不成功可能不得不重作。非阻塞算法一般叫做乐观算法，由于它们继续操做的假设是不会有干扰。若是发现干扰，就会回退并重试。在计数器的示例中，冒险的步骤是递增——它检索旧值并在旧值上加一，但愿在计算更新期间值不会变化。若是它的但愿落空，就会再次检索值，并重作递增计算。

再来一个例子，Michael-Scott 非阻塞队列算法的插入操做，ConcurrentLinkedQueue 就是用这个算法实现的，如今来结合示意图分析一下，很明朗：

public class LinkedQueue <E> { private staticclass Node <E> { final E item; final AtomicReference<Node<E>> next; Node(E item, Node<E> next) { this.item = item; this.next = new AtomicReference<Node<E>>(next); } } private AtomicReference<Node<E>> head = new AtomicReference<Node<E>>(new Node<E>(null,null)); private AtomicReference<Node<E>> tail = head; public boolean put(E item) { Node<E> newNode = new Node<E>(item,null); while (true) { Node<E> curTail = tail.get(); Node<E> residue = curTail.next.get(); if (curTail == tail.get()) { if (residue == null)/* A */ { if (curTail.next.compareAndSet(null, newNode))/* C */ { tail.compareAndSet(curTail, newNode) /* D */ ; return true; } } else { tail.compareAndSet(curTail, residue) /* B */; } } } } }

看看这代码彻底就是ConcurrentLinkedQueue 源码啊。

插入一个元素涉及头指针和尾指针两个指针更新，这两个更新都是经过 CAS 进行的：从队列当前的最后节点（C）连接到新节点，并把尾指针移动到新的最后一个节点（D）。若是第一步失败，那么队列的状态不变，插入线程会继续重试，直到成功。一旦操做成功，插入被当成生效，其余线程就能够看到修改。还须要把尾指针移动到新节点的位置上，可是这项工做能够当作是 “清理工做”，由于任何处在这种状况下的线程均可以判断出是否须要这种清理，也知道如何进行清理。

队列老是处于两种状态之一：正常状态（或称静止状态，图 1 和图 3）或中间状态（图 2）。在插入操做以前和第二个 CAS（D）成功以后，队列处在静止状态；在第一个 CAS（C）成功以后，队列处在中间状态。在静止状态时，尾指针指向的连接节点的 next 字段总为 null，而在中间状态时，这个字段为非 null。任何线程经过比较 tail.next 是否为 null，就能够判断出队列的状态，这是让线程能够帮助其余线程 “完成” 操做的关键。
上图显示的是：有两个元素，处在静止状态的队列

　　插入操做在插入新元素（A）以前，先检查队列是否处在中间状态。若是是在中间状态，那么确定有其余线程已经处在元素插入的中途，在步骤（C）和（D）之间。没必要等候其余线程完成，当前线程就能够 “帮助” 它完成操做，把尾指针向前移动（B）。若是有必要，它还会继续检查尾指针并向前移动指针，直到队列处于静止状态，这时它就能够开始本身的插入了。第一个 CAS（C）可能由于两个线程竞争访问队列当前的最后一个元素而失败；在这种状况下，没有发生修改，失去 CAS 的线程会从新装入尾指针并再次尝试。若是第二个 CAS（D）失败，插入线程不须要重试 —— 由于其余线程已经在步骤（B）中替它完成了这个操做！

　　上图显示的是：处在插入中间状态的队列，在新元素插入以后，尾指针更新以前

　　上图显示的是：在尾指针更新后，队列从新处在静止状态