JVM-内存模型

时间 2019-11-22

标签 jvm 内存模型栏目 Java 繁體版

原文原文链接

Java并发是基于共享内存模型实现的。学习并深刻地理解__Java内存模型__，有助于开发人员了解Java的线程间通讯机制原理，从而实现安全且高效的多线程功能。java

处理器内存模型

计算机在执行程序时，每条指令都是在__CPU__中执行的，而执行指令过程当中，势必涉及到对主存中数据的读取和写入。因为__CPU__的处理速度相比对内存数据的访问速度快不少，若是任什么时候候对数据的操做都要经过和内存的交互来进行，会大大下降指令执行的速度。所以在__CPU__里面就有了高速缓存。编程

然而引入高速缓存带来方便的同时，也带来了缓存一致性的问题。当多个处理器的运算任务都涉及同一块主内存区域时，将可能致使各自缓存数据不一致的问题。解决方法是缓存一致性协议（如Intel 的MESI协议）。缓存

MESI协议保证了每一个缓存中使用的共享变量的副本是一致的。当CPU写数据时，若是发现操做的变量是共享变量，会发出信号通知其余CPU将该变量的缓存行置为无效状态。所以当其余CPU须要读取这个变量时，发现本身缓存中缓存该变量的缓存行是无效的，那么它就会从内存从新读取。安全

除了增长高速缓存以外，为了使得处理器内部的运算单元能尽可能被充分利用，处理器可能会对输入代码进行乱序执行（Out-Of-Order Execution）优化，处理器会在计算以后将乱序执行的结果重组，保证该结果与顺序执行的结果是一致的，但并不保证程序中各个语句计算的前后顺序与输入代码中的顺序一致，所以，若是存在一个计算任务依赖另一个计算任务的中间结果，那么其顺序性并不能靠代码的前后顺序来保证。多线程

Java内存模型

Java内存模型（Java Memory Model ,JMM）就是一种符合内存模型规范的，屏蔽了各类硬件和操做系统的访问差别的，保证了Java程序在各类平台下对内存的访问都能保证效果一致的机制及规范。架构

为了方便理解Java内存模型，咱们能够抽象地认为，全部变量都存储在主内存中（Main Memory），每一个线程都拥有一个私有的工做内存（Working Memory），保存了该线程已访问的变量副本。线程对变量的全部操做都必须在工做内存中进行，而不能直接对主存进行操做。并发

假设__线程A__要向__线程B__发消息，__线程A__须要先在本身的工做内存中更新变量，再将变量同步到主内存中，随后__线程B__再去主内存中读取A更新过的变量。于是能够看出，JMM经过控制主内存与每一个线程的本地内存之间的交互，提供内存可见性保证。app

内存交互操做

Java内存模型定义的8个操做指令来进行内存之间的交互，以下：函数

read 读取主内存的值，并传输至工做内存。
load 将read的变量值存放到工做内存。
use 将工做内存的变量值，传递给执行引擎。
assign 执行引擎对变量进行赋值。
store 工做内存将变量传输到主内存。
write 主内存将工做内存传递过来的变量进行存储。
lock 用做主内存变量，它把一个变量在内存里标识为一个线程独占状态。
unlock 用做主内存变量，它对被锁定的变量进行解锁。

工做内存和主内存间的指令操做交互，以下图所示：性能

指令规则

read 和 load、store和write必须成对出现
assign操做，工做内存变量改变后必须刷回主内存
同一时间只能运行一个线程对变量进行lock，当前线程lock可重入，unlock次数必须等于lock的次数，该变量才能解锁。
对一个变量lock后，会清空该线程工做内存变量的值，从新执行load或者assign操做初始化工做内存中变量的值。
unlock前，必须将变量同步到主内存（store/write操做）。

重排序

在没有正确同步的状况下，即便要推断最简单的并发程序的行为也很困难。代码以下：

public class PossibleReordering {
static int x = 0, y = 0;
static int a = 0, b = 0;

public static void main(String[] args) throws InterruptedException {
    Thread one = new Thread(new Runnable() {
        public void run() {
            a = 1;
            x = b;
        }
    });

    Thread other = new Thread(new Runnable() {
        public void run() {
            b = 1;
            y = a;
        }
    });
    one.start();
    other.start();
    one.join();other.join();
    System.out.println(“(” + x + “,” + y + “)”);
}
复制代码

很容易想象PossibleReordering的输出结果是（1，0）或（0，1）或（1：1）的，__但奇怪的是__还能够输出（0，0）。

因为每一个线程中的各个操做之间不存在数据依赖性，所以这些操做能够乱序执行。下图给出了一种可能由重排序致使的交替执行方式，在这种状况中会输出（0，0）。

Java源代码到最终实际执行的指令序列，会分别经历下面3种重排序，如图所示：

在执行程序时，为了提升性能，编译器和处理器会对指令作重排序。重排序分3种类型：

编译器优化重排序。编译器在不改变单线程程序语义（as-if-serial semantics）的前提下，可从新安排语句的执行顺序。
指令级并行的重排序。现代处理器采用了指令级并行技术来将多条指令重叠执行。若是不存在数据依赖性，处理器能够改变语句对应机器指令的执行顺序。
内存系统的重排序。因为处理器使用缓存和读/写缓冲区，这使得加载和存储操做看上去多是在乱序执行。

先行发生原则（happens-before）

为了提升执行性能，JMM容许编译器和处理器对指令进行重排序。可是Java语言保证了操做间具备必定的有序性，归纳起来就是先行发生原则（happens-before）。也就是说，若是两个操做的关系没法被happens-before原则推导，则没法保证它们的顺序性，有可能发生重排序。happens-before原则包括：

程序次序规则：一个线程内，按照代码顺序，书写在前面的操做先行发生于书写在后面的操做
锁定规则：一个unlock操做先行发生于后面对同一个锁的lock操做。
volatile变量规则：对一个volatile变量的写操做先行发生于后面对这个变量的读操做
线程启动规则：Thread对象的start()方法先行发生于此线程的每一个一个动做
线程终结规则：线程中的全部操做都先行发生于对此线程的终止检测
线程中断规则：对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生
对象终结规则：一个对象的初始化完成先行发生于它的finalize()方法的开始
传递规则：若是操做A先行发生于操做B，操做B先行发生于操做C，则有A先行发生于操做C。

实际上，这些规则是由编译器重排序规则和处理器内存屏障插入策略来实现的。

内存屏障

内存屏障是一条CPU指令，用于控制特定条件下的重排序和内存可见性问题。即任何指令都不能与内存屏障指令重排序。

LoadLoad屏障:对于这样的语句Load1; LoadLoad; Load2，在Load2及后续读取操做要读取的数据被访问前，保证Load1要读取的数据被读取完毕。
StoreStore屏障：对于这样的语句Store1; StoreStore; Store2，在Store2及后续写入操做执行前，保证Store1的写入操做对其它处理器可见。
LoadStore屏障：对于这样的语句Load1; LoadStore; Store2，在Store2及后续写入操做被刷出前，保证Load1要读取的数据被读取完毕。
StoreLoad屏障：对于这样的语句Store1; StoreLoad; Load2，在Load2及后续全部读取操做执行前，保证Store1的写入对全部处理器可见。

处理器对重排序的支持

从上面能够看到不一样的处理器架构对重排序的支持也是不同（其它处理器架构暂不罗列），因此不一样的平台JMM的内存屏障施加也略有不一样，具体来讲，好比 X86 对Load1Load2不支持重排序，那么你就没有必要施加 LoadLoad屏障。

volatile的内存语义

volatile关键字用来保证数据可见性，防止指令重排的效果。包括JUC里AQS Lock的底层实现也是基于volatitle来实现。

volatile写的内存语义：当写一个volatile变量的时候，JMM会把该线程对应的本地内存变量值刷新到主内存。
volatile读的内存语义：当读一个volatile变量的时候，JMM会把线程本次内存置为无效。线程接下来将从主内存中读取共享变量（也就是从新从主内存获取值，更新运行内存中的本地变量）。

final的内存语义

final修饰的称做域，对于final域，编译器和处理器要遵照两个重排序规则

写规则：在构造函数内对一个final域的写入，与随后把这个被构造的对象的引用赋值给一个引用变量，这两个操做不可重排序。

JMM禁止编译器把final域的写重排序到构造函数以外，编译器会在final域写入的后面插入StoreStore屏障，该规则能够保证在对象引用为任意线程可见以前，对象的final域已经被正确初始化，而普通域没法保障。
读规则：初次读一个包含final域的对象的引用，与随后初次读这个final域，这两个操做之间不能重排序。

在一个线程中，初次读对象引用与初次读该对象包含的final域，JMM禁止处理器重排序这两个操做。编译器会在读final域操做的前面插入一个LoadLoad屏障。

类库Happens-Before

因为Happens-Before的排序功能很强，所以有时候能够“借助”现有机制的可见性属性。这须要将Happens-Before的程序顺序规则与其余某个顺序规则（一般是监视器锁规则或者volatile变量规则）结合起来，从而对某个未被锁保护的变量的访问操做进行排序。由类库担保的其余happens-before排序包括：

将一个元素放入线程安全容器happens-before于另外一个线程从容器中获取元素。
执行CountDownLatch中的倒计时happens-before于线程从闭锁（latch）的await中返回。
释放一个许可证Semaphorehappens-before于从同一Semaphore里得到一个许可。
Future表现的任务所发生的动做happens-before于另外一个线程成功地从Future.get中返回。
向Executor提交一个Runnable或Callable happens-before于开始执行任务。
一个线程到达CyclicBarrier或Exchanger happens-before于相同关卡（barrier）或Exchange点中的其余线程被释放。若是CyclicBarrier使用一个关卡（barrier）动做，到达关卡happens-before于关卡动做，依照次序，关卡动做happens-before于线程从关卡中释放。

参考资料

[Java内存模型与指令重排序]:（ mp.weixin.qq.com/s/nxmcwIeKh…
[聊聊java内存模型]: (www.jianshu.com/p/59ac0e3f9…
深刻理解Java虚拟机
Java并发编程实战