Basic Of Concurrency(二十三: 非阻塞算法下)

时间 2019-11-07

标签 basic concurrency 二十三阻塞算法栏目 Java 繁體版

原文原文链接

共享预期修改

一个线程可以共享它的预期修改来替代拷贝和修改内存中的整个数据结构.一个线程须要进行以下几个操做来实现对一个共享数据的预期修改:html

检查是否有其余线程已经提交一个预期修改到数据结构了
若是其余线程尚未提交一个预期修改,那就建立一个预期修改(一般是一个对象)并提交它到数据结构(经过一个cas操做).
对共享数据结构执行预期修改.
移除预期修改的引用来发送信号给其余线程通知它们预期修改已经被执行了.

如你所见,第二个操做提交一个预期修改会阻塞其余线程.由于第二个操做实际上等同于做用在共享数据结构上的锁.若是一个线程成功提交一个预期修改,那么其余线程将没法提交预期修改,直到上一个提交的预期修改被执行为止.java

若是一个线程提交一个预期修改后由于执行其余任务而发生阻塞,那么共享数据结构等同于锁死.共享数据结构并不会直接阻塞其余线程来使用它.其余线程可以检测到没法提交预期修改而后再决定作些什么.很明显,咱们须要解决这种状况.算法

可完善的预期修改

为了解决提交一个预期修改会锁住共享数据结构的问题,一个提交的预期修改对象须要包含足够的信息以让其余线程能够继续完成这些修改.这样,当线程提交一个预期修改后没法完成它时,其余线程能够经过它本身的方式来完成此次修改,同时让共享数据结构能继续被其余线程使用.数据结构

下图描述了上文给出的非阻塞算法设想:多线程

修改必须经过一到屡次cas操做来进行.所以,若是有两个线程同时尝试完成预期修改,只会有一个线程可以成功完成.并发

ABA问题

上文描述的算法中会遇到ABA问题.ABA问题是指一个变量从A更改到B,再从B被更改到A的时候,其余线程没法检测到变量实际上已经被修改过了.工具

若是一个线程A先检查是否有正在进行的更改,而后拷贝数据再而后就被线程调度器挂起了,此时线程B在同一时间访问共享数据结构.此时若是线程B对共享数据执行了一个完整的修改,而后移除预期修改对象的引用,那么对于线程A来讲,它会误觉得自从拷贝数据结构后预期修改并无被替换过.然而,预期修改的的确确已经被替换过了.当线程A基于过时的数据结构副本进行修改时,实际上内存中的数据结构已经被线程B的修改替换了.post

下图描述了上文讨论的ABA问题的场景:性能

ABA解决方案

一个通用的解决方案,不仅仅只是替换掉预期修改对象的指针,同时须要更新一个计数器,且替换预期修改对象指针和更新计数器须要在一个cas操做中完成.这在C和C++的指针中是可行的.所以,即便当前预期修改对象的指针被设置为"没有进行中的预期修改"的状态,仍然会有一个计数器来记录预期修改被更新的次数,以保障更新对其余线程可见.学习

在Java中不能合并一个引用和计数器到一个变量中.但Java中提供了一个AtomicStampedReference对象用于完成在一个cas操做中同时替换引用和一个标记.

一个非阻塞算法的模版

下面提供了一个代码模版,这个模版提供了一个实现非阻塞算法的思路.这个模版基于上文给出的思路实现.

须要注意的是: 这份模版的做者并非一个专业非阻塞算法工程师,模版中可能会有几处错误.因此告诫咱们千万不要基于这个模版去实现本身的非阻塞算法.这个模版只是示例了非阻塞算法的实现代码的思路.若是你须要实现一个非阻塞算法,那么你须要研读其余更专业的书籍.须要了解一个非阻塞算法是如何实现和工做的,以及如何在实践中编码实现它.(如做者所说,他只是提供了一个思路,笔者在学习完这篇博文后总以为做者提供非阻塞算法思路并不完整,因此看成入门资料是能够,但要真正掌握非阻塞算法还有很长的路要走.)

import java.util.concurrent.atomic.AtomicBoolean;
import java.util.concurrent.atomic.AtomicStampedReference;

public class NonblockingTemplate {

    public static class IntendedModification {
        public AtomicBoolean completed =
                new AtomicBoolean(false);
    }

    private AtomicStampedReference<IntendedModification> ongoingMod = new AtomicStampedReference<IntendedModification>(null, 0);

    //declare the state of the data structure here.

    public void modify() {
        while(!attemptModifyASR());
    }

    public boolean attemptModifyASR(){
        boolean modified = false;
    
        IntendedModification currentlyOngoingMod = ongoingMod.getReference();
        int stamp = ongoingMod.getStamp();
    
        if(currentlyOngoingMod == null){
            //copy data structure state - for use
            //in intended modification
        
            //prepare intended modification
            IntendedModification newMod = new IntendedModification();
        
            boolean modSubmitted = ongoingMod.compareAndSet(null, newMod, stamp, stamp + 1);
        
            if(modSubmitted){       
                //complete modification via a series of compare-and-swap operations.
                //note: other threads may assist in completing the compare-and-swap
                // operations, so some CAS may fail
            
                modified = true;
            }
        } else {
            //attempt to complete ongoing modification, so the data structure is freed up
            //to allow access from this thread.
        
            modified = false;
        }    
        return modified;
    }
}
复制代码

非阻塞算法很是难实现

非阻塞算法很难被正确的设计和实现.在尝试实现你本身的非阻塞算法前,不妨查看一下有没有人已经实现过了.

Java中已经实现了一小部分非阻塞算法(例如ConcurrentLinkedQueue)且在将来会有更多的非阻塞算法实现加入到Java版本中.

除了Java中内建的一些非阻塞算法实现外,还有一些开源的数据结构可选.例如,LMAX Disrupter(一个相似队列的数据结构)和由Cliff Click实现的非阻塞版本的HashMap.

非阻塞算法带来的好处

对比阻塞算法,非阻塞算法可以给咱们带来诸多好处.如下列出详细的说明:

可选的

非阻塞算法带来的第一个好处是: 线程的请求操做被拒绝时能够选择作些什么而不是直接被阻塞掉.有时候线程的请求操做被拒绝后确实不知道应该作什么.这个时候能够选择阻塞或是挂起来让出CPU运行时间片去作其余任务.但这至少给予了请求线程一次选择的机会.

在单CPU的系统上,当线程的请求操做没法被执行时将会被挂起以腾出CPU运行时间片来作其余事情.可是,即便在单CPU的系统上,阻塞算法仍然会带来死锁,饥饿和其余并发问题.

没有死锁

第二个好处是: 一个线程的挂起不会致使其余线程的挂起.这意味着不会有死锁发生.两个线程不会互相等待对方释放本身所须要的锁.线程的请求操做不能被执行时不会发生阻塞,所以它们不须要阻塞以相互等待对方执行完成.非阻塞算法虽然不会发生死锁,但会发生活锁,两个线程都在尝试执行操做,但一直被告知这些操做不能执行(由于其余线程正在操做的过程当中, 理论上是有可能发生的).

没有线程被挂起

挂起和恢复一个线程的性能消耗是十分昂贵的.即便在操做系统和线程工具已经很是高效的状况下,挂起和恢复线程对性能的消耗已经很小了.可是咱们仍然须要记住挂起和恢复一个线程是一笔不小的性能消耗(能避免则避免).

当一个线程被阻塞挂起时,须要消耗而外的性能来恢复它们.而在非阻塞算法中,线程不会挂起,这些性能消耗就不会发生.这意味着CPU有更多的运行时间片来执行真正的业务逻辑而不是线程的上下文切换.

在多线程系统中,阻塞算法会对程序的执行效率产生严重的影响.在CPU A上运行的线程可能会被阻塞以等待CPU B上运行的线程.这会下降应用程序的并发性.即便让CPU A切换另一个线程来执行,线程间的上下文切换仍然是十分昂贵的.越少线程被挂起越好.

下降线程的延迟

延迟在这里是指一个线程发起请求操做到真正被执行的所通过的时间.线程在非阻塞算法中不会被挂起,所以它们没有昂贵的恢复成本.这意味着当一个线程的请求操做可以被执行时,线程能够快速响应从而最大程度的减小它们的响应延迟.

非阻塞算法一般能够在请求操做真正可以被执行时经过繁忙等待的方式来取得最小的响应延迟.固然,若是一个线程在非阻塞数据结构上的竞争状况比较激烈的话,那么CPU会花费大量的运行时间片在繁忙等待上.因此咱们须要谨记,多个线程在数据结构上竞争状况比较激烈的状况下,非阻塞算法就显得不是那么合适了.然而,比较常见的作法是重构咱们的应用,让线程尽可能少的争夺内存中的数据结构.

该系列博文为笔者复习基础所著译文或理解后的产物,复习原文来自Jakob Jenkov所著Java Concurrency and Multithreading Tutorial

上一篇: 非阻塞算法上
 下一篇: 阿姆达尔定律