并发编程（一）—— volatile关键字和 atomic包

时间 2019-11-08

原文原文链接

本文将讲解volatile关键字和 atomic包，为何放到一块儿讲呢，主要是由于这两个能够解决并发编程中的原子性、可见性、有序性，让咱们一块儿来看看吧。java

Java内存模型

JMM（java内存模型）编程

　　java虚拟机有本身的内存模型（Java Memory Model，JMM），JMM能够屏蔽掉各类硬件和操做系统的内存访问差别，以实现让java程序在各类平台下都能达到一致的内存访问效果。缓存

　　JMM决定一个线程对共享变量的写入什么时候对另外一个线程可见，JMM定义了线程和主内存之间的抽象关系：共享变量存储在主内存(Main Memory)中，每一个线程都有一个私有的本地内存（Local Memory），本地内存保存了被该线程使用到的主内存的副本拷贝，线程对变量的全部操做都必须在工做内存中进行，而不能直接读写主内存中的变量。这三者之间的交互关系以下多线程

计算机在执行程序时，每条指令都是在CPU中执行的，而执行指令过程当中，势必涉及到数据的读取和写入。因为程序运行过程当中的临时数据是存放在主存（物理内存）当中的，这时就存在一个问题，因为CPU执行速度很快，而从内存读取数据和向内存写入数据的过程跟CPU执行指令的速度比起来要慢的多，所以若是任什么时候候对数据的操做都要经过和内存的交互来进行，会大大下降指令执行的速度。所以在CPU里面就有了高速缓存。并发

　　也就是，当程序在运行过程当中，会将运算须要的数据从主存复制一份到CPU的高速缓存当中，那么CPU进行计算时就能够直接从它的高速缓存读取数据和向其中写入数据，当运算结束以后，再将高速缓存中的数据刷新到主存当中。举个简单的例子，好比下面的这段代码：ide

i = i + 1;

当线程执行这个语句时，会先从主存当中读取i的值，而后复制一份到高速缓存当中，而后CPU执行指令对i进行加1操做，而后将数据写入高速缓存，最后将高速缓存中i最新的值刷新到主存当中。post

　　这个代码在单线程中运行是没有任何问题的，可是在多线程中运行就会有问题了。在多核CPU中，每条线程可能运行于不一样的CPU中，所以每一个线程运行时有本身的高速缓存（对单核CPU来讲，其实也会出现这种问题，只不过是以线程调度的形式来分别执行的）。本文咱们以多核CPU为例。性能

　　好比同时有2个线程执行这段代码，假如初始时i的值为0，那么咱们但愿两个线程执行完以后i的值变为2。可是事实会是这样吗？优化

　　可能存在下面一种状况：初始时，两个线程分别读取i的值存入各自所在的CPU的高速缓存当中，而后线程1进行加1操做，而后把i的最新值1写入到内存。此时线程2的高速缓存当中i的值仍是0，进行加1操做以后，i的值为1，而后线程2把i的值写入内存。this

　　最终结果i的值是1，而不是2。这就是著名的缓存一致性问题。一般称这种被多个线程访问的变量为共享变量。

并发编程中的三个概念

　　在并发编程中，咱们一般会遇到如下三个问题：原子性问题，可见性问题，有序性问题。咱们先看具体看一下这三个概念：

1.原子性

　　原子性：即一个操做或者多个操做要么所有执行而且执行的过程不会被任何因素打断，要么就都不执行。

　　一个很经典的例子就是银行帐户转帐问题：

　　好比从帐户A向帐户B转1000元，那么必然包括2个操做：从帐户A减去1000元，往帐户B加上1000元。

　　试想一下，若是这2个操做不具有原子性，会形成什么样的后果。假如从帐户A减去1000元以后，操做忽然停止。而后又从B取出了500元，取出500元以后，再执行往帐户B加上1000元的操做。这样就会致使帐户A虽然减去了1000元，可是帐户B没有收到这个转过来的1000元。

　　因此这2个操做必需要具有原子性才能保证不出现一些意外的问题。

2.可见性

　　可见性是指当多个线程访问同一个变量时，一个线程修改了这个变量的值，其余线程可以当即看获得修改的值。

　　举个简单的例子，看下面这段代码：

1 //线程1执行的代码
2 int i = 0;
3 i = 10;
4  
5 //线程2执行的代码
6 j = i;

倘若执行线程1的是CPU1，执行线程2的是CPU2。由上面的分析可知，当线程1执行 i =10这句时，会先把i的初始值加载到CPU1的高速缓存中，而后赋值为10，那么在CPU1的高速缓存当中i的值变为10了，却没有当即写入到主存当中。

此时线程2执行 j = i，它会先去主存读取i的值并加载到CPU2的缓存当中，注意此时内存当中i的值仍是0，那么就会使得j的值为0，而不是10。

这就是可见性问题，线程1对变量i修改了以后，线程2没有当即看到线程1修改的值。

3.有序性

　　有序性：即程序执行的顺序按照代码的前后顺序执行。举个简单的例子，看下面这段代码：

int i = 0;              
boolean flag = false;
i = 1;                //语句1  
flag = true;          //语句2

从代码顺序上看，语句1是在语句2前面的，那么JVM在真正执行这段代码的时候会保证语句1必定会在语句2前面执行吗？不必定，为何呢？这里可能会发生指令重排序（Instruction Reorder）。

通常来讲，处理器为了提升程序运行效率，可能会对输入代码进行优化，它不保证程序中各个语句的执行前后顺序同代码中的顺序一致，可是它会保证程序最终执行结果和代码顺序执行的结果是一致的。

好比上面的代码中，语句1和语句2谁先执行对最终的程序结果并无影响，那么就有可能在执行过程当中，语句2先执行而语句1后执行。

可是重排序也须要遵照必定规则：

　　1.重排序操做不会对存在数据依赖关系的操做进行重排序。

　　　　好比：a=1;b=a; 这个指令序列，因为第二个操做依赖于第一个操做，因此在编译时和处理器运行时这两个操做不会被重排序。

　　2.重排序是为了优化性能，可是无论怎么重排序，单线程下程序的执行结果不能被改变

　　　　好比：a=1;b=2;c=a+b这三个操做，第一步（a=1)和第二步(b=2)因为不存在数据依赖关系，因此可能会发生重排序，可是c=a+b这个操做是不会被重排序的，由于须要保证最终的结果必定是c=a+b=3。

volatile关键字

　 volatile是Java提供的一种轻量级的同步机制。同synchronized相比（synchronized一般称为重量级锁），volatile更轻量级。

　　一旦一个共享变量（类的成员变量、类的静态成员变量）被volatile修饰以后，那么就具有了两层语义：

　　1）保证了不一样线程对这个变量进行操做时的可见性，即一个线程修改了某个变量的值，这新值对其余线程来讲是当即可见的。

　　2）禁止进行指令重排序。

一、共享变量的可见性

public class TestVolatile {
    
    public static void main(String[] args) {
        ThreadDemo td = new ThreadDemo();
        new Thread(td).start();
        while(true){
            if(td.isFlag()){
                System.out.println("------------------");
                break;
            }
        }
    }

}

class ThreadDemo implements Runnable {
    private  boolean flag = false;
    @Override
    public void run() {
        try {
            Thread.sleep(200);
        } catch (InterruptedException e) {
        }
        flag = true;
        System.out.println("flag=" + isFlag());
    }

    public boolean isFlag() {
        return flag;
    }
}

上面这个例子，开启一个多线程去改变flag为true，main 主线程中能够输出"------------------"吗？

　　答案是NO!

　　这个结论会让人有些疑惑，能够理解。开启的线程虽然修改了flag 的值为true,可是还没来得及写入主存当中，此时main里面的 td.isFlag()仍是false,可是因为 while(true) 是底层的指令来实现，速度很是之快，一直循环都没有时间去主存中更新td的值，因此这里会形成死循环！运行结果以下：

此时线程是没有中止的，一直在循环。

如何解决呢？只需将 flag 声明为volatile，便可保证在开启的线程A将其修改成true时，main主线程能够马上得知：

　　第一：使用volatile关键字会强制将修改的值当即写入主存；

　　第二：使用volatile关键字的话，当开启的线程进行修改时，会致使main线程的工做内存中缓存变量flag的缓存行无效（反映到硬件层的话，就是CPU的L1缓存中对应的缓存行无效）；

　　第三：因为线程main的工做内存中缓存变量flag的缓存行无效，因此线程main再次读取变量flag的值时会去主存读取。

volatile具有两种特性，第一就是保证共享变量对全部线程的可见性。将一个共享变量声明为volatile后，会有如下效应：

　　1.当写一个volatile变量时，JMM会把该线程对应的本地内存中的变量强制刷新到主内存中去；

　　2.这个写会操做会致使其余线程中的缓存无效。

二、禁止进行指令重排序

这里咱们引用上篇文章单例里面的例子

 1 class Singleton{
 2     private volatile static Singleton instance = null;
 3 
 4     private Singleton() {
 5     }
 6      
 7     public static Singleton getInstance() {
 8         if(instance==null) {
 9             synchronized (Singleton.class) {
10                 if(instance==null)
11                     instance = new Singleton();
12             }
13         }
14         return instance;
15     }
16 }

instance = new Singleton(); 这段代码能够分为三个步骤：
一、memory = allocate() 分配对象的内存空间
二、ctorInstance() 初始化对象
三、instance = memory 设置instance指向刚分配的内存

可是此时有可能发生指令重排，CPU 的执行顺序可能为：

一、memory = allocate() 分配对象的内存空间
三、instance = memory 设置instance指向刚分配的内存
二、ctorInstance() 初始化对象

在单线程的状况下，1->3->2这种顺序执行是没有问题的，可是若是是多线程的状况则有可能出现问题，线程A执行到11行代码，执行了指令1和3，此时instance已经有值了，值为第一步分配的内存空间地址，可是尚未进行对象的初始化；

此时线程B执行到了第8行代码处，此时instance已经有值了则return instance，线程B 使用instance的时候，就会出现异常。

这里能够使用 volatile 来禁止指令重排序。

从上面知道volatile关键字保证了操做的可见性和有序性，可是volatile能保证对变量的操做是原子性吗？

下面看一个例子：

package com.mmall.concurrency.example.count;
import java.util.concurrent.CountDownLatch;

/**
 * @author: ChenHao
 * @Description:
 * @Date: Created in 15:05 2018/11/16
 * @Modified by:
 */
public class CountTest {
    // 请求总数
    public static int clientTotal = 5000;
    public static volatile int count = 0;

    public static void main(String[] args) throws Exception {
        //使用CountDownLatch来等待计算线程执行完
        final CountDownLatch countDownLatch = new CountDownLatch(clientTotal);
        //开启clientTotal个线程进行累加操做
        for(int i=0;i<clientTotal;i++){
            new Thread(){
                public void run(){
                    count++;//自加操做
                    countDownLatch.countDown();
                }
            }.start();
        }
        //等待计算线程执行完
        countDownLatch.await();
        System.out.println(count);
    }
}

执行结果：

针对这个示例，一些同窗可能会以为疑惑，若是用volatile修饰的共享变量能够保证可见性，那么结果不该该是5000么?

问题就出在count++这个操做上，由于count++不是个原子性的操做，而是个复合操做。咱们能够简单讲这个操做理解为由这三步组成:

　　1.读取count

　　2.count 加 1

　　3.将count 写到主存

　　因此，在多线程环境下，有可能线程A将count读取到本地内存中，此时其余线程可能已经将count增大了不少，线程A依然对过时的本地缓存count进行自加，从新写到主存中，最终致使了count的结果不合预期，而是小于5000。

那么如何来解决这个问题呢？下面咱们来看看

Atomic包

在java 1.5的java.util.concurrent.atomic包下提供了一些原子操做类，即对基本数据类型的自增（加1操做），自减（减1操做）、以及加法操做（加一个数），减法操做（减一个数）进行了封装，保证这些操做是原子性操做。atomic是利用CAS来实现原子性操做的（Compare And Swap）

package com.mmall.concurrency.example.count;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.atomic.AtomicInteger;

/**
 * @author: ChenHao
 * @Description:
 * @Date: Created in 15:05 2018/11/16
 * @Modified by:
 */
public class CountTest {
    // 请求总数
    public static int clientTotal = 5000;
    public static AtomicInteger count = new AtomicInteger(0);

    public static void main(String[] args) throws Exception {
        //使用CountDownLatch来等待计算线程执行完
        final CountDownLatch countDownLatch = new CountDownLatch(clientTotal);
        //开启clientTotal个线程进行累加操做
        for(int i=0;i<clientTotal;i++){
            new Thread(){
                public void run(){
                    count.incrementAndGet();//先加1，再get到值
                    countDownLatch.countDown();
                }
            }.start();
        }
        //等待计算线程执行完
        countDownLatch.await();
        System.out.println(count);
    }
}

执行结果:

下面咱们来看看原子类操做的基本原理

 1 public final int incrementAndGet() {
 2      return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
 3 }
 4 
 5 public final int getAndAddInt(Object var1, long var2, int var4) {
 6     int var5;
 7     do {
 8         var5 = this.getIntVolatile(var1, var2);
 9     } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));
10 
11     return var5;
12 }
13 
14 /***
15 * 获取obj对象中offset偏移地址对应的整型field的值。
16 * @param obj 包含须要去读取的field的对象
17 * @param obj中整型field的偏移量
18 */
19 public native int getIntVolatile(Object obj, long offset);
20 
21 /**
22 * 比较obj的offset处内存位置中的值和指望的值，若是相同则更新。此更新是不可中断的。
23 * 
24 * @param obj 须要更新的对象
25 * @param offset obj中整型field的偏移量
26 * @param expect 但愿field中存在的值
27 * @param update 若是指望值expect与field的当前值相同，设置filed的值为这个新值
28 * @return 若是field的值被更改返回true
29 */
30 public native boolean compareAndSwapInt(Object obj, long offset, int expect, int update);

首先介绍一下什么是Compare And Swap(CAS)？简单的说就是比较并交换。

CAS 操做包含三个操做数 —— 内存位置（V）、预期原值（A）和新值(B)。若是内存位置的值与预期原值相匹配，那么处理器会自动将该位置值更新为新值。不然，处理器不作任何操做。不管哪一种状况，它都会在 CAS 指令以前返回该位置的值。CAS 有效地说明了“我认为位置 V 应该包含值 A；若是包含该值，则将 B 放到这个位置；不然，不要更改该位置，只告诉我这个位置如今的值便可。” Java并发包(java.util.concurrent)中大量使用了CAS操做,涉及到并发的地方都调用了sun.misc.Unsafe类方法进行CAS操做。

咱们来分析下incrementAndGet的逻辑：

　　1.先获取当前的value值

　　2.调用compareAndSet方法来来进行原子更新操做，这个方法的语义是：

　　　　先检查当前value是否等于obj中整型field的偏移量处的值，若是相等，则意味着obj中整型field的偏移量处的值 没被其余线程修改过，更新并返回true。若是不相等，compareAndSet则会返回false，而后循环继续尝试更新。

第一次count 为0时线程A调用incrementAndGet时，传参为 var1=AtomicInteger(0)，var2为var1 里面 0 的偏移量，好比为8090，var4为须要加的数值1,var5为线程工做内存值，do里面会先执行一次，经过getIntVolatile 获取obj对象中offset偏移地址对应的整型field的值此时var5=0;while 里面compareAndSwapInt 比较obj的8090处内存位置中的值和指望的值var5，若是相同则更新obj的值为(var5+var4=1)，此时更新成功，返回true,则 while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));结束循环，return var5。

当count 为0时，线程B 和线程A 同时读取到 count ,进入到第 8 行代码处，线程B 也是取到的var5=0,当线程B 执行到compareAndSwapInt时，线程A已经执行完compareAndSwapInt，已经将内存地址为8090处的值修改成1，此时线程B 执行compareAndSwapInt返回false,则继续循环执行do里面的语句，再次取内存地址偏移量为8090处的值为1，再去执行compareAndSwapInt，更新obj的值为(var5+var4=2)，返回为true,结束循环，return var5。

CAS的ABA问题

　　固然CAS也并不完美，它存在"ABA"问题，倘若一个变量初次读取是A，在compare阶段依然是A，但其实可能在此过程当中，它先被改成B，再被改回A，而CAS是没法意识到这个问题的。CAS只关注了比较先后的值是否改变，而没法清楚在此过程当中变量的变动明细，这就是所谓的ABA漏洞。