Java 内存模型 JMM 深度解析

时间 2019-11-26

标签 java 内存模型 jmm 深度解析栏目 Java 繁體版

原文原文链接

JMM简介

Java Memory Model简称JMM, 是一系列的Java虚拟机平台对开发者提供的多线程环境下的内存可见性、是否能够重排序等问题的无关具体平台的统一的保证。(可能在术语上与Java运行时内存分布有歧义，后者指堆、方法区、线程栈等内存区域)。

有关java虚拟机栈和JVM，能够参考《JVM之Java 运行时的数据区域》。

并发编程有多种风格，除了CSP(通讯顺序进程)、Actor等模型外，你们最熟悉的应该是基于线程和锁的共享内存模型了。在多线程编程中，须要注意三类并发问题:html

原子性
可见性
重排序

原子性涉及到，一个线程执行一个复合操做的时候，其余线程是否可以看到中间的状态、或进行干扰。典型的就是i++的问题了，两个线程同时对共享的堆内存执行++操做，而++操做在JVM、运行时、CPU中的实现均可能是一个复合操做, 例如在JVM指令的角度来看是将i的值从堆内存读到操做数栈、加上1、再写回到堆内存的i，这几个操做的期间，若是没有正确的同步，其余线程也能够同时执行，可能致使数据丢失等问题。常见的原子性问题又叫竞太条件，是基于一个可能失效的结果进行判断，如读取-修改-写入。可见性和重排序问题都源于系统的优化。java

因为CPU的执行速度和内存的存取速度严重不匹配，为了优化性能，基于时间局部性、空间局部性等局部性原理，CPU在和内存间增长了多层高速缓存，当须要取数据时，CPU会先到高速缓存中查找对应的缓存是否存在，存在则直接返回，若是不存在则到内存中取出并保存在高速缓存中。如今多核处理器越基本已经成为标配，这时每一个处理器都有本身的缓存，这就涉及到了缓存一致性的问题，CPU有不一样强弱的一致性模型，最强的一致性安全性最高，也符合咱们的顺序思考的模式，可是在性能上由于须要不一样CPU之间的协调通讯就会有不少开销。编程

典型的CPU缓存结构示意图以下数组

CPU的指令周期一般为取指令、解析指令读取数据、执行指令、数据写回寄存器或内存。串行执行指令时其中的读取存储数据部分占用时间较长，因此CPU广泛采起指令流水线的方式同时执行多个指令, 提升总体吞吐率，就像工厂流水线同样。缓存

读取数据和写回数据到内存相比执行指令的速度不在一个数量级上，因此CPU使用寄存器、高速缓存做为缓存和缓冲，在从内存中读取数据时，会读取一个缓存行(cache line)的数据（相似磁盘读取读取一个block）。数据写回的模块在旧数据没有在缓存中的状况下会将存储请求放入一个store buffer中继续执行指令周期的下一个阶段，若是存在于缓存中则会更新缓存，缓存中的数据会根据必定策略flush到内存。安全

public class MemoryModel {
    private int count;
    private boolean stop;
    public void initCountAndStop() {
        count = 1;
        stop = false;
    }
    public void doLoop() {
        while(!stop) {
            count++;
        }
    }
    public void printResult() {
        System.out.println(count);
        System.out.println(stop);
    }
}复制代码

上面这段代码执行时咱们可能认为count = 1会在stop = false前执行完成，这在上面的CPU执行图中显示的理想状态下是正确的，可是要考虑上寄存器、缓存缓冲的时候就不正确了, 例如stop自己在缓存中可是count不在，则可能stop更新后再count的write buffer写回以前刷新到了内存。bash

另外CPU、编译器（对于Java通常指JIT）均可能会修改指令执行顺序，例如上述代码中count = 1和stop = false二者并无依赖关系，因此CPU、编译器都有可能修改这二者的顺序，而在单线程执行的程序看来结果是同样的，这也是CPU、编译器要保证的as-if-serial(无论如何修改执行顺序，单线程的执行结果不变)。因为很大部分程序执行都是单线程的，因此这样的优化是能够接受而且带来了较大的性能提高。可是在多线程的状况下，若是没有进行必要的同步操做则可能会出现使人意想不到的结果。例如在线程T1执行完initCountAndStop方法后，线程T2执行printResult，获得的多是0, false, 多是1, false, 也多是0, true。若是线程T1先执行doLoop()，线程T2一秒后执行initCountAndStop, 则T1可能会跳出循环、也可能因为编译器的优化永远没法看到stop的修改。多线程

因为上述这些多线程状况下的各类问题，多线程中的程序顺序已经不是底层机制中的执行顺序和结果，编程语言须要给开发者一种保证，这个保证简单来讲就是一个线程的修改什么时候对其余线程可见，所以Java语言提出了JavaMemoryModel即Java内存模型，对于Java语言、JVM、编译器等实现者须要按照这个模型的约定来进行实现。Java提供了Volatile、synchronized、final等机制来帮助开发者保证多线程程序在全部处理器平台上的正确性。并发

在JDK1.5以前，Java的内存模型有着严重的问题，例如在旧的内存模型中，一个线程可能在构造器执行完成后看到一个final字段的默认值、volatile字段的写入可能会和非volatile字段的读写重排序。app

因此在JDK1.5中，经过JSR133提出了新的内存模型，修复以前出现的问题。

重排序规则

volatile和监视器锁

是否能够重排序	第二个操做	第二个操做	第二个操做
第一个操做	普通读/普通写	volatile读/monitor enter	volatile写/monitor exit
普通读/普通写			No
voaltile读/monitor enter	No	No	No
volatile写/monitor exit		No	No

其中普通读指getfield, getstatic, 非volatile数组的arrayload, 普通写指putfield, putstatic, 非volatile数组的arraystore。

volatile读写分别是volatile字段的getfield, getstatic和putfield, putstatic。

monitorenter是进入同步块或同步方法,monitorexist指退出同步块或同步方法。

上述表格中的No指前后两个操做不容许重排序，如(普通写, volatile写)指非volatile字段的写入不能和以后任意的volatile字段的写入重排序。当没有No时，说明重排序是容许的，可是JVM须要保证最小安全性-读取的值要么是默认值，要么是其余线程写入的（64位的double和long读写操做是个特例，当没有volatile修饰时，并不能保证读写是原子的，底层可能将其拆分为两个单独的操做）。

final字段

final字段有两个额外的特殊规则

final字段的写入（在构造器中进行）以及final字段对象自己的引用的写入都不能和后续的（构造器外的）持有该final字段的对象的写入重排序。例如, 下面的语句是不能重排序的
```
x.finalField = v; ...; sharedRef = x;复制代码
```
final字段的第一次加载不能和持有这个final字段的对象的写入重排序，例以下面的语句是不容许重排序的
```
x = sharedRef; ...; i = x.finalField复制代码
```

内存屏障

处理器都支持必定的内存屏障(memory barrier)或栅栏(fence)来控制重排序和数据在不一样的处理器间的可见性。例如，CPU将数据写回时，会将store请求放入write buffer中等待flush到内存，能够经过插入barrier的方式防止这个store请求与其余的请求重排序、保证数据的可见性。能够用一个生活中的例子类比屏障，例如坐地铁的斜坡式电梯时，你们按顺序进入电梯，可是会有一些人从左侧绕过去，这样出电梯时顺序就不相同了，若是有一我的携带了一个大的行李堵住了（屏障），则后面的人就不能绕过去了:)。另外这里的barrier和GC中用到的write barrier是不一样的概念。

内存屏障的分类

几乎全部的处理器都支持必定粗粒度的barrier指令，一般叫作Fence(栅栏、围墙)，可以保证在fence以前发起的load和store指令都能严格的和fence以后的load和store保持有序。一般按照用途会分为下面四种barrier

LoadLoad Barriers

Load1; LoadLoad; Load2;

保证Load1的数据在Load2及以后的load前加载

StoreStore Barriers

Store1; StoreStore; Store2

保证Store1的数据先于Store2及以后的数据在其余处理器可见

LoadStore Barriers

Load1; LoadStore; Store2

保证Load1的数据的加载在Store2和以后的数据flush前

StoreLoad Barriers

Store1; StoreLoad; Load2

保证Store1的数据在其余处理器前可见(如flush到内存)先于Load2和以后的load的数据的加载。StoreLoad Barrier可以防止load读取到旧数据而不是最近其余处理器写入的数据。

几乎近代的全部的多处理器都须要StoreLoad，StoreLoad的开销一般是最大的，而且StoreLoad具备其余三种屏障的效果，因此StoreLoad能够当作一个通用的(可是更高开销的)屏障。

因此，利用上述的内存屏障，能够实现上面表格中的重排序规则

须要的屏障	第二个操做	第二个操做	第二个操做	第二个操做
第一个操做	普通读	普通写	volatile读/monitor enter	volatile写/monitor exit
普通读				LoadStore
普通读				StoreStore
voaltile读/monitor enter	LoadLoad	LoadStore	LoadLoad	LoadStore
volatile写/monitor exit			StoreLoad	StoreStore

为了支持final字段的规则，须要对final的写入增长barrier

x.finalField = v; StoreStore; sharedRef = x;

插入内存屏障

基于上面的规则，能够在volatile字段、synchronized关键字的处理上增长屏障来知足内存模型的规则

volatile store前插入StoreStore屏障
全部final字段写入后但在构造器返回前插入StoreStore
volatile store后插入StoreLoad屏障
在volatile load后插入LoadLoad和LoadStore屏障
monitor enter和volatile load规则一致，monitor exit 和volatile store规则一致。

HappenBefore

前面提到的各类内存屏障对应开发者来讲仍是比较复杂底层，所以JMM又可使用一系列HappenBefore的偏序关系的规则方式来讲明，要想保证执行操做B的线程看到操做A的结果（不管A和B是否在同一个线程中执行), 那么在A和B之间必需要知足HappenBefore关系，不然JVM能够对它们任意重排序。

HappenBefore规则列表

HappendBefore规则包括

程序顺序规则: 若是程序中操做A在操做B以前，那么同一个线程中操做A将在操做B以前进行
监视器锁规则: 在监视器锁上的锁操做必须在同一个监视器锁上的加锁操做以前执行
volatile变量规则: volatile变量的写入操做必须在该变量的读操做以前执行
线程启动规则: 在线程上对Thread.start的调用必须在该线程中执行任何操做以前执行
线程结束规则: 线程中的任何操做都必须在其余线程检测到该线程已经结束以前执行
中断规则: 当一个线程在另外一个线程上调用interrupt时，必须在被中断线程检测到interrupt以前执行
传递性: 若是操做A在操做B以前执行，而且操做B在操做C以前执行，那么操做A在操做C以前执行。

其中显示锁与监视器锁有相同的内存语义，原子变量与volatile有相同的内存语义。锁的获取和释放、volatile变量的读取和写入操做知足全序关系，因此可使用volatile的写入在后续的volatile的读取以前进行。

能够利用上述HappenBefore的多个规则进行组合。

例如线程A进入监视器锁后，在释放监视器锁以前的操做根据程序顺序规则HappenBefore于监视器释放操做，而监视器释放操做HappenBefore于后续的线程B的对相同监视器锁的获取操做，获取操做HappenBefore与线程B中的操做。