Java内存模型(Java Memory Model,JMM)是java虚拟机规范定义的,用来屏蔽掉java程序在各类不一样的硬件和操做系统对内存的访问的差别,这样就能够实现java程序在各类不一样的平台上都能达到内存访问的一致性。能够避免像c++等直接使用物理硬件和操做系统的内存模型在不一样操做系统和硬件平台下表现不一样,好比有些c/c++程序可能在windows平台运行正常,而在linux平台却运行有问题。java
物理硬件和内存linux
首先,在单核电脑中,处理问题要简单的多。对内存和硬件的要求,各类方面的考虑没有在多核的状况下复杂。电脑中,CPU的运行计算速度是很是快的,而其余硬件好比IO,网络、内存读取等等,跟cpu的速度比起来是差几个数量级的。而无论任何操做,几乎是不可能都在cpu中完成而不借助于任何其余硬件操做。因此协调cpu和各个硬件之间的速度差别是很是重要的,要否则cpu就一直在等待,浪费资源。而在多核中,不只面临如上问题,还有若是多个核用到了同一个数据,如何保证数据的一致性、正确性等问题,也是必需要解决的。c++
目前基于高速缓存的存储交互很好的解决了cpu和内存等其余硬件之间的速度矛盾,多核状况下各个处理器(核)都要遵循必定的诸如MSI、MESI等协议来保证内存的各个处理器高速缓存和主内存的数据的一致性。
除了增长高速缓存,为了使处理器内部运算单元尽量被充分利用,处理器还会对输入的代码进行乱序执行(Out-Of-Order Execution)优化,处理器会在乱序执行以后的结果进行重组,保证结果的正确性,也就是保证结果与顺序执行的结果一致。可是在真正的执行过程当中,代码执行的顺序并不必定按照代码的书写顺序来执行,可能和代码的书写顺序不一样。windows
Java内存模型数组
虽然java程序全部的运行都是在虚拟机中,涉及到的内存等信息都是虚拟机的一部分,但实际也是物理机的,只不过是虚拟机做为最外层的容器统一作了处理。虚拟机的内存模型,以及多线程的场景下与物理机的状况是很类似的,能够类比参考。缓存
Java内存模型的主要目标是定义程序中变量的访问规则。即在虚拟机中将变量存储到主内存或者将变量从主内存取出这样的底层细节。须要注意的是这里的变量跟咱们写java程序中的变量不是彻底等同的。这里的变量是指实例字段,静态字段,构成数组对象的元素,可是不包括局部变量和方法参数(由于这是线程私有的)。这里能够简单的认为主内存是java虚拟机内存区域中的堆,局部变量和方法参数是在虚拟机栈中定义的。可是在堆中的变量若是在多线程中都使用,就涉及到了堆和不一样虚拟机栈中变量的值的一致性问题了。安全
Java内存模型中涉及到的概念有:微信
这里须要说明一下:主内存、工做内存与java内存区域中的java堆、虚拟机栈、方法区并非一个层次的内存划分。这二者是基本上是没有关系的,上文只是为了便于理解,作的类比
网络
工做内存与主内存交互多线程
物理机高速缓存和主内存之间的交互有协议,一样的,java内存中线程的工做内存和主内存的交互是由java虚拟机定义了以下的8种操做来完成的,每种操做必须是原子性的(double和long类型在某些平台有例外,参考volatile详解和非原子性协定)
java虚拟机中主内存和工做内存交互,就是一个变量如何从主内存传输到工做内存中,如何把修改后的变量从工做内存同步回主内存。
若是要把一个变量从主内存传输到工做内存,那就要顺序的执行read和load操做,若是要把一个变量从工做内存回写到主内存,就要顺序的执行store和write操做。对于普通变量,虚拟机只是要求顺序的执行,并无要求连续的执行,因此以下也是正确的。对于两个线程,分别从主内存中读取变量a和b的值,并不同要read a; load a; read b; load b; 也会出现以下执行顺序:read a; read b; load b; load a; (对于volatile修饰的变量会有一些其余规则,后边会详细列出),对于这8中操做,虚拟机也规定了一系列规则,在执行这8中操做的时候必须遵循以下的规则:
固然,最重要的仍是如开始所说,这8个动做必须是原子的,不可分割的。
针对volatile修饰的变量,会有一些特殊规定。
Volatile修饰的变量的特殊规则
关键字volatile能够说是java虚拟机中提供的最轻量级的同步机制。java内存模型对volatile专门定义了一些特殊的访问规则。这些规则有些晦涩拗口,先列出规则,而后用更加通俗易懂的语言来解释:
假定T表示一个线程,V和W分别表示两个volatile修饰的变量,那么在进行read、load、use、assign、store和write操做的时候须要知足以下规则:
总结上面三条规则,前面两条能够归纳为:Volatile类型的变量保证对全部线程的可见性。第三条为:*Volatile类型的变量禁止指令重排序优化。
可见性是指当一个线程修改了这个变量的值,新值(修改后的值)对于其余线程来讲是当即能够得知的。正如上面的前两条规则规定,volatile类型的变量每次值被修改了就当即同步回主内存,每次使用时就须要从主内存从新读取值。返回到前面对普通变量的规则中,并无要求这一点,因此普通变量的值是不会当即对全部线程可见的。
误解 :volatile变量对全部线程是当即可见的,因此对volatile变量的全部修改(写操做)都马上能反应到其余线程中。或者换句话说:volatile变量在各个线程中是一致的,因此基于volatile变量的运算在并发下是线程安全的。
这个观点的论据是正确的,可是根据论据得出的结论是错误的,并不能得出这样的结论。
volatile的规则,保证了read、load、use的顺序和连续行,同理assign、store、write也是顺序和连续的。也就是这几个动做是原子性的,可是对变量的修改,或者对变量的运算,却不能保证是原子性的。若是对变量的修改是分为多个步骤的,那么多个线程同时从主内存拿到的值是最新的,可是通过多步运算后回写到主内存的值是有可能存在覆盖状况发生的。以下代码的例子:
public class VolatileTest { public static volatile int race = 0; public static void increase() { race++ } private static final int THREADS_COUNT = 20; public void static main(String[] args) { Thread[] threads = new Thread[THREADS_COUNT); for (int = 0; i < THREADS_COUNT; i++) { threads[i] = new Thread(new Runnable(){ @Override public void run() { for (int j = 0; j < 10000; j++) { increase(); } } }); threads[i].start(); } while (Thread.activeCount() > 1) { Thread.yield(); } System.out.println(race); } }
代码就是对volatile类型的变量启动了20个线程,每一个线程对变量执行1w次加1操做,若是volatile变量并发操做没有问题的话,那么结果应该是输出20w,可是结果运行的时候每次都是小于20w,这就是由于race++操做不是原子性的,是分多个步骤完成的。假设两个线程a、b同时取到了主内存的值,是0,这是没有问题的,在进行++操做的时候假设线程a执行到一半,线程b执行完了,这时线程b当即同步给了主内存,主内存的值为1,而线程a此时也执行完了,同步给了主内存,此时的值仍然是1,线程b的结果被覆盖掉了。
普通的变量仅仅会保证在该方法执行的过程当中,全部依赖赋值结果的地方都能获取到正确的结果,但不能保证变量赋值的操做顺序和程序代码的顺序一致。由于在一个线程的方法执行过程当中没法感知到这一点,这也就是java内存模型中描述的所谓的“线程内部表现为串行的语义”。
也就是在单线程内部,咱们看到的或者感知到的结果和代码顺序是一致的,即便代码的执行顺序和代码顺序不一致,可是在须要赋值的时候结果也是正确的,因此看起来就是串行的。但实际结果有可能代码的执行顺序和代码顺序是不一致的。这在多线程中就会出现问题。
看下面的伪代码举例:
Map configOptions; char[] configText; //volatile类型bianliang volatile boolean initialized = false; //假设如下代码在线程A中执行 //模拟读取配置信息,读取完成后认为是初始化完成 configOptions = new HashMap(); configText = readConfigFile(fileName); processConfigOptions(configText, configOptions); initialized = true; //假设如下代码在线程B中执行 //等待initialized为true后,读取配置信息进行操做 while ( !initialized) { sleep(); } doSomethingWithConfig();
若是initialiezd是普通变量,没有被volatile修饰,那么线程A执行的代码的修改初始化完成的结果initialized = true就有可能先于以前的三行代码执行,而此时线程B发现initialized为true了,就执行doSomethingWithConfig()方法,可是里面的配置信息都是null的,就会出现问题了。
如今initialized是volatile类型变量,保证禁止代码重排序优化,那么就能够保证initialized = true执行的时候,前边的三行代码必定执行完成了,那么线程B读取的配置文件信息就是正确的。
跟其余保证并发安全的工具相比,volatile的性能确实会好一些。在某些状况下,volatile的同步机制性能要优于锁(使用synchronized关键字或者java.util.concurrent包中的锁)。可是如今因为虚拟机对锁的不断优化和实行的许多消除动做,很难有一个量化的比较。
与本身相比,就能够肯定一个原则:volatile变量的读操做和普通变量的读操做几乎没有差别,可是写操做会性能差一些,慢一些,由于要在本地代码中插入许多内存屏障指令来禁止指令重排序,保证处理器不发生代码乱序执行行为。
long和double变量的特殊规则
Java内存模型要求对主内存和工做内存交换的八个动做是原子的,正如章节开头所讲,对long和double有一些特殊规则。八个动做中lock、unlock、read、load、use、assign、store、write对待32位的基本数据类型都是原子操做,对待long和double这两个64位的数据,java虚拟机规范对java内存模型的规定中特别定义了一条相对宽松的规则:容许虚拟机将没有被volatile修饰的64位数据的读写操做划分为两次32位的操做来进行,也就是容许虚拟机不保证对64位数据的read、load、store和write这4个动做的操做是原子的。这也就是咱们常说的long和double的非原子性协定(Nonautomic Treatment of double and long Variables)。
并发内存模型的实质
Java内存模型围绕着并发过程当中如何处理原子性、可见性和顺序性这三个特征来设计的。
原子性(Automicity)
由Java内存模型来直接保证原子性的变量操做包括read、load、use、assign、store、write这6个动做,虽然存在long和double的特例,但基本能够忽律不计,目前虚拟机基本都对其实现了原子性。若是须要更大范围的控制,lock和unlock也能够知足需求。lock和unlock虽然没有被虚拟机直接开给用户使用,可是提供了字节码层次的指令monitorenter和monitorexit对应这两个操做,对应到java代码就是synchronized关键字,所以在synchronized块之间的代码都具备原子性。
可见性
有序性从不一样的角度来看是不一样的。单纯单线程来看都是有序的,但到了多线程就会跟咱们预想的不同。能够这么说:若是在本线程内部观察,全部操做都是有序的;若是在一个线程中观察另外一个线程,全部的操做都是无序的。前半句说的就是“线程内表现为串行的语义”,后半句值得是“指令重排序”现象和主内存与工做内存之间同步存在延迟的现象。
保证有序性的关键字有volatile和synchronized,volatile禁止了指令重排序,而synchronized则由“一个变量在同一时刻只能被一个线程对其进行lock操做”来保证。
整体来看,synchronized对三种特性都有支持,虽然简单,可是若是无控制的滥用对性能就会产生较大影响。
先行发生原则
若是Java内存模型中全部的有序性都要依靠volatile和synchronized来实现,那是否是很是繁琐。Java语言中有一个“先行发生原则”,是判断数据是否存在竞争、线程是否安全的主要依据。
什么是先行发生原则
先行发生原则是Java内存模型中定义的两个操做之间的偏序关系。好比说操做A先行发生于操做B,那么在B操做发生以前,A操做产生的“影响”都会被操做B感知到。这里的影响是指修改了内存中的共享变量、发送了消息、调用了方法等。我的以为更直白一些就是有可能对操做B的结果有影响的都会被B感知到,对B操做的结果没有影响的是否感知到没有太大关系。
Java内存模型自带先行发生原则有哪些
private int value = 0; public void setValue(int value) { this.value = value; } public int getValue() { return this.value; }
若是有两个线程A和B,A先调用setValue方法,而后B调用getValue方法,那么B线程执行方法返回的结果是什么?
咱们去对照先行发生原则一个一个对比。首先是程序次序规则,这里是多线程,不在一个线程中,不适用;而后是管程锁定规则,这里没有synchronized,天然不会发生lock和unlock,不适用;后面对于线程启动规则、线程终止规则、线程中断规则也不适用,这里与对象终结规则、传递性规则也没有关系。因此说B返回的结果是不肯定的,也就是说在多线程环境下该操做不是线程安全的。
如何修改呢,一个是对get/set方法加入synchronized 关键字,可使用管程锁定规则;要么对value加volatile修饰,可使用volatile变量规则。
经过上面的例子可知,一个操做时间上先发生并不表明这个操做先行发生,那么一个操做先行发生是否是表明这个操做在时间上先发生?也不是,以下面的例子:
int i = 2; int j = 1;
在同一个线程内,对i的赋值先行发生于对j赋值的操做,可是代码重排序优化,也有多是j的赋值先发生,咱们没法感知到这一变化。
因此,综上所述,时间前后顺序与先行发生原则之间基本没有太大关系。咱们衡量并发安全的问题的时候不要受到时间前后顺序的干扰,一切以先行发生原则为准。
做者:_fan凡
https://www.jianshu.com/p/15106e9c4bf3
欢迎关注个人微信公众号「码农突围」,分享Python、Java、大数据、机器学习、人工智能等技术,关注码农技术提高•职场突围•思惟跃迁,20万+码农成长充电第一站,陪有梦想的你一块儿成长