一文带你精通CAS,由浅入深,直击灵魂

推荐阅读:阿里二面凉经:虚拟机+MySQL+中间件+设计模式+缓存+Spring+并发等难题,所有迎刃而解

后端开发中你们确定遇到过实现一个线程安全的计数器这种需求,根据经验你应该知道咱们要在多线程中实现 共享变量 的原子性和可见性问题,因而锁成为一个不可避免的话题,今天咱们讨论的是与之对应的无锁 CAS。本文会从怎么来的、是什么、怎么用、原理分析、遇到的问题等不一样的角度带你真正搞懂 CAS。java

为何要无锁

咱们一想到在多线程下保证安全的方式头一个要拎出来的确定是锁,无论从硬件、操做系统层面都或多或少在使用锁。锁有什么缺点吗?固然有了,否则 JDK 里为何出现那么多各式各样的锁,就是由于每一种锁都有其优劣势。程序员

一文带你精通CAS,由浅入深,直击灵魂

使用锁就须要得到锁、释放锁,CPU 须要经过上下文切换和调度管理来进行这个操做,对于一个 独占锁 而言一个线程在持有锁后没执行结束其余的哥们就必须在外面等着,等到前面的哥们执行完毕 CPU 大哥就会把锁拿出来其余的线程来抢了(非公平)。锁的这种概念基于一种悲观机制,它老是认为数据会被修改,因此你在操做一部分代码块以前先加一把锁,操做完毕后再释放,这样就安全了。其实在 JDK1.5 使用 synchronized 就能够作到。算法

一文带你精通CAS,由浅入深,直击灵魂

可是像上面的操做在多线程下会让 CPU 不断的切换,很是消耗资源,咱们知道可使用具体的某一类锁来避免部分问题。那除了锁的方式还有其余的吗?固然,有人就提出了无锁算法,比较有名的就是咱们今天要说的 CAS(compare and swap),和锁不一样的是它是一种乐观的机制,它认为别人去拿数据的时候不会修改,可是在修改数据的时候去判断一下数据此时的状态,这样的话 CPU 不会切换,在读多的状况下性能将获得大幅提高。当前咱们使用的大部分 CPU 都有 CAS 指令了,从硬件层面支持无锁,这样开发的时候去调用就能够了。数据库

不管是锁仍是无锁都有其优劣势,后面咱们也会经过例子说明 CAS 的问题。编程

什么是 CAS

前面提了无锁的 CAS,那到底 CAS 是个啥呢?我已经火烧眉毛了,咱们来看看维基百科的解释后端

比较并交换(compare and swap, CAS),是原子操做的一种,可用于在多线程编程中实现不被打断的数据交换操做,从而避免多线程同时改写某一数据时因为执行顺序不肯定性以及中断的不可预知性产生的数据不一致问题。 该操做经过将内存中的值与指定数据进行比较,当数值同样时将内存中的数据替换为新的值。设计模式

CAS 给咱们提供了一种思路,经过 比较 和 替换 来完成原子性,来看一段代码:缓存

int cas(long *addr, long old, long new) {
    /* 原子执行 */
    if(*addr != old)
        return 0;
    *addr = new;
    return 1;
}

这是一段 c 语言代码,能够看到有 3 个参数,分别是:安全

  • *addr: 进行比较的值
  • old: 内存当前值
  • new: 准备修改的新值,写入到内存

只要咱们当前传入的进行比较的值和内存里的值相等,就将新值修改为功,不然返回 0 告诉比较失败了。学过数据库的同窗都知道悲观锁和乐观锁,乐观锁老是认为数据不会被修改。基于这种假设 CAS 的操做也认为内存里的值和当前值是相等的,因此操做老是能成功,咱们能够不须要加锁就实现多线程下的原子性操做。多线程

在多线程状况下使用 CAS 同时更新同一个变量时,只有其中一个线程能更新变量的值,而其它线程都失败,失败的线程并不会被阻塞挂起,而是告诉它此次修改失败了,你能够从新尝试,因而能够写这样的代码。

while (!cas(&addr, old, newValue)) {

}
// success
printf("new value = %ld", addr);

不过这样的代码相信你可能看出其中的蹊跷了,这个咱们后面来分析,下面来看看 Java 里是怎么用 CAS 的。

Java 里的 CAS

仍是前面的问题,若是让你用 Java 的 API 来实现你可能会想到两种方式,一种是加锁(多是 synchronized 或者其余种类的锁),另外一种是使用 atomic 类,如 AtomicInteger,这一系列类是在 JDK1.5 的时候出现的,在咱们经常使用的 java.util.concurrent.atomic 包下,咱们来看个例子:

ExecutorService executorService = Executors.newCachedThreadPool();
AtomicInteger   atomicInteger   = new AtomicInteger(0);

for (int i = 0; i < 5000; i++) {
    executorService.execute(atomicInteger::incrementAndGet);
}

System.out.println(atomicInteger.get());
executorService.shutdown();

这个例子开启了 5000 个线程去进行累加操做,无论你执行多少次答案都是 5000。这么神奇的操做是如何实现的呢?就是依靠 CAS 这种技术来完成的,咱们揭开 AtomicInteger 的老底看看它的代码:

public class AtomicInteger extends Number implements java.io.Serializable {
    private static final long serialVersionUID = 6214790243416807050L;

    // setup to use Unsafe.compareAndSwapInt for updates
    private static final Unsafe unsafe = Unsafe.getUnsafe();
    private static final long valueOffset;

    static {
        try {
            valueOffset = unsafe.objectFieldOffset
                (AtomicInteger.class.getDeclaredField("value"));
        } catch (Exception ex) { throw new Error(ex); }
    }

    private volatile int value;

    /**
     * Creates a new AtomicInteger with the given initial value.
     *
     * @param initialValue the initial value
     */
    public AtomicInteger(int initialValue) {
        value = initialValue;
    }

    /**
     * Gets the current value.
     *
     * @return the current value
     */
    public final int get() {
        return value;
    }

    /**
     * Atomically increments by one the current value.
     *
     * @return the updated value
     */
    public final int incrementAndGet() {
        return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
    }

}

这里我只帖出了咱们前面例子相关的代码,其余都是相似的,能够看到 incrementAndGet 调用了 unsafe.getAndAddInt 方法。Unsafe 这个类是 JDK 提供的一个比较底层的类,它不让咱们程序员直接使用,主要是怕操做不当把机器玩坏了。。。(其实能够经过反射的方式获取到这个类的实例)你会在 JDK 源码的不少地方看到这家伙,咱们先说说它有什么能力:

  • 内存管理:包括分配内存、释放内存
  • 操做类、对象、变量:经过获取对象和变量偏移量直接修改数据
  • 挂起与恢复:将线程阻塞或者恢复阻塞状态
  • CAS:调用 CPU 的 CAS 指令进行比较和交换
  • 内存屏障:定义内存屏障,避免指令重排序

这里只是大体提一下经常使用的操做,具体细节能够在文末的参考连接中查看。下面咱们继续看 unsafe 的 getAndAddInt 在作什么。

public final int getAndAddInt(Object var1, long var2, int var4) {
    int var5;
    do {
        var5 = this.getIntVolatile(var1, var2);
    } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));

    return var5;
}

public native int getIntVolatile(Object var1, long var2);
public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);

其实很简单,先经过 getIntVolatile 获取到内存的当前值,而后进行比较,展开 compareAndSwapInt 方法的几个参数:

  • var1: 当前要操做的对象(其实就是 AtomicInteger 实例)
  • var2: 当前要操做的变量偏移量(能够理解为 CAS 中的内存当前值)
  • var4: 指望内存中的值
  • var5: 要修改的新值

因此 this.compareAndSwapInt(var1, var2, var5, var5 + var4) 的意思就是,比较一下 var2 和内存当前值 var5 是否相等,若是相等那我就将内存值 var5 修改成 var5 + var4var4 就是 1,也能够是其余数)。


这里咱们还须要解释一下 偏移量 是个啥?你在前面的代码中可能看到这么一段:

// setup to use Unsafe.compareAndSwapInt for updates
private static final Unsafe unsafe = Unsafe.getUnsafe();
private static final long valueOffset;

static {
    try {
        valueOffset = unsafe.objectFieldOffset
            (AtomicInteger.class.getDeclaredField("value"));
    } catch (Exception ex) { throw new Error(ex); }
}

private volatile int value;

能够看出在静态代码块执行的时候将 AtomicInteger 类的 value 这个字段的偏移量获取出来,拿这个 long 数据干吗呢?在 Unsafe 类里不少地方都须要传入 obj 和偏移量,结合咱们说 Unsafe 的诸多能力,其实就是直接经过更底层的方式将对象字段在内存的数据修改掉。

使用上面的方式就能够很好的解决多线程下的原子性和可见性问题。因为代码里使用了 do while 这种循环结构,因此 CPU 不会被挂起,比较失败后重试,就不存在上下文切换了,实现了无锁并发编程。

CAS 存在的问题

自旋的劣势

你留意上面的代码会发现一个问题,while 循环若是在最坏状况下老是失败怎么办?会致使 CPU 在不断处理。像这种 while(!compareAndSwapInt) 的操做咱们称之为自旋,CAS 是乐观的,认为你们来并不都是修改数据的,现实可能出现很是多的线程过来都要修改这个数据,此时随着并发量的增长会致使 CAS 操做长时间不成功,CPU 也会有很大的开销。因此咱们要清楚,若是是读多写少的状况也就知足乐观,性能是很是好的。

ABA 问题

提到 CAS 不得不说 ABA 问题,它是说假如内存的值原来是 A,被一个线程修改成了 B,此时又有一个线程把它修改成了 A,那么 CAS 确定是操做成功的。真的这样作的话代码可能就有 bug 了,对于修改数据为 B 的那个线程它应该读取到 B 而不是 A,若是你作过数据库相关的乐观锁机制可能会想到咱们在比较的时候使用一个版本号 version 来进行判断就能够搞定。在 JDK 里提供了一个 AtomicStampedReference 类来解决这个问题,来看一个例子:

int stamp = 10001;

AtomicStampedReference<Integer> stampedReference = new AtomicStampedReference<>(0, stamp);

stampedReference.compareAndSet(0, 10, stamp, stamp + 1);

System.out.println("value: " + stampedReference.getReference());
System.out.println("stamp: " + stampedReference.getStamp());

它的构造函数是 2 个参数,多传入了一个初始 时间戳,用这个戳来给数据加了一个版本,这样的话多个线程来修改若是提供的戳不一样。在修改数据的时候除了提供一个新的值以外还要提供一个新的戳,这样在多线程状况下只要数据被修改了那么戳必定会发生改变,另外一个线程拿到的是旧的戳因此会修改失败。

尝试应用

既然 CAS 提供了这么好的 API,咱们不妨用它来实现一个简易版的独占锁。思路是当某个线程进入 lock 方法就比较锁对象的内存值是不是 false,若是是则表明这把锁它能够获取,获取后将内存之修改成 true,获取不到就自旋。在 unlock 的时候将内存值再修改成 false 便可,代码以下:

public class SpinLock {

    private AtomicBoolean mutex = new AtomicBoolean(false);

    public void lock() {
        while (!mutex.compareAndSet(false, true)) {
            // System.out.println(Thread.currentThread().getName()+ " wait lock release");
        }
    }

    public void unlock() {
        while (!mutex.compareAndSet(true, false)) {
            // System.out.println(Thread.currentThread().getName()+ " wait lock release");
        }
    }

}

这里使用了 AtomicBoolean 这个类,固然用 AtomicInteger 也是能够的,由于咱们只保存一个状态 boolean 占用比较小就用它了。这个锁的实现比较简单,缺点很是明显,因为 while 循环致使的自旋会让其余线程都在占用 CPU,可是也可使用,关于锁的优化版本实现我会在后续的文章中进行改进和说明,正由于这些问题咱们也会在后续研究 AQS 这把利器的优势。

CAS 源码

看了上面的这些代码和解释相信你对 CAS 已经理解了,下面咱们要说的原理是前面的 native 方法中的 C++ 代码写了什么,在 openjdk 的 /hotspot/src/share/vm/prims 目录中有一个 Unsafe.cpp 文件中有这样一段代码:

注意:这里以 hotspot 实现为例

UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))
  UnsafeWrapper("Unsafe_CompareAndSwapInt");
  oop p = JNIHandles::resolve(obj);
  // 经过偏移量获取对象变量地址
  jint* addr = (jint *) index_oop_from_field_offset_long(p, offset);
  // 执行一个原子操做
  // 若是结果和如今不一样,就直接返回,由于有其余人修改了;不然会一直尝试去修改。直到成功。
  return (jint)(Atomic::cmpxchg(x, addr, e)) == e;
UNSAFE_END
相关文章
相关标签/搜索