非阻塞算法在并发上下文下是指一个算法容许线程访问共享状态(亦或是协做和沟通)时不会阻塞到其余相关线程.更通俗的讲,一个非阻塞算法是指在该算法中一个线程的停顿并不会引发其余相关线程的停顿.html
为了更好的理解阻塞和非阻塞并发算法之间的区别,咱们会先讲解阻塞算法再讲解非阻塞算法.java
一个阻塞的并发算法须要包含如下两个行为:算法
许多算法和并发数据结构都是阻塞的.例如,全部java.util.concurrent.BlockingQueue
接口的实现类都是阻塞的数据结构.若是一个线程尝试插入元素到一个阻塞队列中而且发现队列已经没有剩余空间了,那么插入线程会被阻塞直到阻塞队列中有剩余空间能够插入元素为止.缓存
如下示例图描述了一个阻塞算法保证共享数据结构安全访问的行为:安全
一个非阻塞并发算法须要包含如下两个行为:数据结构
Java中同时包含了一些非阻塞数据结构.像AtomicBoolean, AtomicInteger, AtomicLong 和 AtomicReference都是非阻塞数据结构活生生的例子.多线程
如下示例图描述了一个非阻塞算法保证共享数据结构安全访问的行为:并发
非阻塞和阻塞算法之间的不一样主要体如今上文说起算法须要包含两个行为中的第二个.换句话说,它们两的不一样之处主要体如今当请求操做不能被执行时作出的响应.post
阻塞算法会阻塞请求线程直到请求操做可以被执行为止.而非阻塞算法则是通知请求线程它的请求操做不能被执行.性能
在阻塞算法中,一个线程可能会被阻塞到它的请求操做可以被安全执行为止.一般其余线程请求操做的阻塞成就了第一个线程请求操做的安全执行.出于某些缘由,若是应用中某些地方的其余线程发生停顿或阻塞,可能致使第一个线程的请求操做没法顺利的执行,那么第一个线程会陷入阻塞甚者是永久阻塞,直到有其余线程执行了必要的操做唤醒它为止.
例如,一个线程在尝试插入元素到一个已经满了的阻塞队列中时,会被阻塞到其余线程取走队列中的元素为止.若是出于某些缘由,在应用中的某些地方负责取走队列元素的线程发生了停顿或阻塞,那么尝试插入元素到阻塞队列中的线程将会发生阻塞甚至是永久阻塞,直到最终有线程取走阻塞队列中的一个元素为止.
在多线程系统中,线程一般须要经过一些不一样类型的数据结构来进行通信.这些数据结构能够是简单的变量,也能够是像队列,map,栈等这样复杂的数据结构.为了确保正确性,多个线程并发访问数据结构时,须要经过一些并发算法来保障.因为这些并发算法的保障才让数据结构成为了并发数据结构.
若是一个算法是经过阻塞的方式来保障并发数据结构的,咱们称为阻塞算法.那么这种数据结构咱们称为阻塞的并发数据结构.
若是一个算法是经过非阻塞的方式来保障并发数据结构的,咱们称为非阻塞算法.那么这种数据结构咱们称为非阻塞的并发数据结构.
每种并发数据结构都是为特定的通信场景设计的.至于须要使用哪一种并发数据结构取决于你的通信场景.咱们在接下来的章节中会讲解几种非阻塞的并发数据结构.而且说明哪些状况下会用到这些数据结构.这些非阻塞并发数据结构工做原理的讲解可以给你一些思路怎么设计和实现一个非阻塞数据结构.
Java中的volatile变量可以让变量始终是从主存中加载的.只要volatile变量被赋予新值就会当即被写回到主存中去.这能够保证volatile变量最新的修改始终能够对运行在其余CPU上的线程可见.其余线程每次都会从主存中加载volatile变量而不是从它们运行CPU上的CPU缓存中.
volatile变量是非阻塞的.对volatile变量值的写入是一个原子操做.它不会被打断.然而,对一个volatile变量的读取更新写入一系列操做并非原子的.也就是说,下面这段代码在多线程环境下仍然会出现竞态条件.
volatile myVar = 0;
...
int temp = myVar;
temp++;
myVar = temp;
复制代码
首先咱们从主存中加载myVar变量而后赋予temp变量.而后对temp变量累加1.而后将变量temp从新赋予myVar,这意味着myVar变量会被当即写回到主存中去.
若是两个线程同时执行这段代码,同时加载变量myVar增长1并将变量值写回到主存中.那么存在必定的风险,原本对myVar变量的加法操做,如今只剩下一个了.(例如两个线程都会读取到变量值19,累加为20,再把20写回).
或许你以为你不会写出像上面这样的代码,但在实操中上面的代码等同于:
myVar++;
复制代码
当你执行这段代码时,myVar变量值会被加载到CPU寄存器或CPU缓存中,进行一次加法操做,而后会将CPU寄存器或缓存中的值写回主存.
某些场景下,你只有一个线程写入共享变量而有多个线程来读取变量.当只有一个线程更新变量时,不管有多少个线程同时读取变量都不会有竞态条件出现.因此只要只有一个写线程的状况下,你均可以使用volatile变量.
竟态条件只会在多个线程同时对一个共享变量作读取更新和写入一系列操做时才会发生.当你只有一个线程执行读取更新写入系列操做而有多个线程执行读取操做时,竟态条件不会发生.
这是一个只有一个写线程场景下的Counter实例,即便没有使用同步装置也不会有并发问题:
public class SingleWriterCounter {
private volatile long count = 0;
/** * 只能让一个相同的线程来调用该方法, * 不然将会有竟态条件出现 */
public void inc() {
this.count++;
}
/** * 这个方法能够被多个读取线程调用 * @return */
public long count() {
return this.count;
}
}
复制代码
当只有一个线程调用inc()的状况下,多个线程能够安全的访问相同的Counter实例.固然相同的线程能够屡次调用inc()方法,而不是只调用一次.多个线程能够同时调用count()方法而不会产生竟态条件.
下图描述了多个线程是如何访问volatile修饰的count变量的:
咱们能够联合使用多个volatile变量来构建数据结构,每个volatile变量均可以被一个线程写入和多个线程读取.每个volatile变量能够被不一样的线程写入(但只能是相同的线程).利用这种数据结构中的volatile变量可让多个线程互相发送信息而不会发生阻塞.
这是一个可让两个写线程操做的counter对象示例:
public class DoubleWriterCounter {
private volatile long countA = 0;
private volatile long countB = 0;
/** * 只能让一个相同的写线程来调用该方法, * 不然会发生竟态条件 */
public void incA() { this.countA++; }
/** * 只能让一个相同的写线程来调用该方法, * 不然会发生竟态条件 */
public void incB() { this.countB++; }
/** * 多个读线程能够调用该方法 */
public long countA() { return this.countA; }
/** * 多个读线程能够调用该方法 */
public long countB() { return this.countB; }
}
复制代码
如你所见,DoubleWriterCounter有两个volatile变量和两对累加和读取方法.只能有一个相同的线程调用incA()和一个相同的线程调用incB().但能够由不一样的线程分别调用incA()和inB()方法.多个线程能够同时调用countA()和countB()方法,而不会出现竟态条件.
DoubleWriterCounter能够用做两个线程之间互相通信.两个count计数器能够用于执行生产任务和消费任务.下图描述了两个线程经过上述数据结构进行通信的场景:
聪明的读者能够发现可使用两个SingleWriterCounter实例来达到DoubleWriterCounter同样的效果.你甚至能够增长更多的SingleWriterCounter实例来实现更多线程之间互相通信.
若是你确实须要知足多个线程同时写入共享变量,那么仅仅是使用volatile已经不够用了.你须要特定类型的互斥访问.下面利用了Java中的synchronized
同步块来使用互斥访问.
public class SynchronizedCounter {
long count = 0;
public void inc() {
synchronized(this) {
count++;
}
}
public long count() {
synchronized(this) {
return this.count;
}
}
}
复制代码
咱们能够注意到inc()和count()方法都被包裹在synchronized
同步块中了.这就是咱们须要解决的问题,即不调用synchronized
同步块和wait()/notify()方法等也能使上文说起代码变成线程安全.
咱们可使用Java中的原子变量AtomicLong来替换两个synchronized
同步块.下面给出的是AtomicLong版本的Counter对象:
public class AtomicCounter {
private AtomicLong count = new AtomicLong(0);
public void inc() {
boolean updated = false;
while(!updated){
long prevCount = this.count.get();
updated = this.count.compareAndSet(prevCount, prevCount + 1);
}
}
public long count() {
return this.count.get();
}
}
复制代码
这个版本与以前的synchronized
同步块版本同样也是线程安全的.这个版本有趣的地方是对inc()方法的更改.inc()方法中的代码再也不包含在synchronized
同步块中.而是更改成:
boolean updated = false;
while(!updated){
long prevCount = this.count.get();
updated = this.count.compareAndSet(prevCount, prevCount + 1);
}
复制代码
这些代码并不全是原子操做.这意味仍然有可能被两个不一样的线程调用,它们会同时执行long = prevCount = this.count.get();
语句,同时会取得更改前Counter中的count变量值.即便这样这些代码仍然不会出现竟态条件.有趣吧!(笔者此刻的感觉:当你对代码的底层知根知底时,即便是while(!updated)这样看似枯燥无味的代码也会变得十分有趣.)
秘密就在于while循环中的第二行代码.compareAndSet()调用是原子的.这段调用会比较AtomicLong中的值是否是预期值,若是符合预期则设置AtomicLong为新的值.这里的compareAndSet()方法直接使用CPU指令级的CAS.所以这里不须要任何同步限制也不须要阻塞线程.省去了阻塞线程所须要的性能开销.
想象一下AtomicLong此时内部值为20.如今同时有两个线程读取该值,并尝试调用compareAndSet(20, 20 + 1)
.因为compareAndSet()是原子操做的,同一时间只能有一个线程执行这个方法.
第一个执行的线程会先比较AtomicLong的内部值是否为20(执行更改前的值),当符合预期时,线程会将AtomicLong的内部值更改成21(20 + 1).若是更改变量成功,会将updated置换为true并中止while循环.
如今第二个线程能够调用compareAndSet(20, 20 + 1)
了.固然如今AtomicLong的内部值已经再也不是20了,这次调用将会失败.AtomicLong的值不会被设置为21.updated变量此时会被置换为false,线程会在while循环上自旋一次,从新进入循环内部.这一次,若是没有其余线程在调用compareAndSet()的话,它会读取到AtomicLong内部值为21,并从新调用compareAndSet(21, 21 + 1)将AtomicLong更新为22.
前文中提到的代码实现咱们称之为乐观锁.乐观锁跟传统的锁不太同样,咱们一般称传统的锁为悲观锁.传统的方式是经过synchronized
同步块和和各类类型的锁来锁住共享内存的访问.一个synchronized
同步块或是锁会致使线程发生阻塞.
乐观锁容许全部线程建立共享内存的副本而不会发生阻塞.线程会对它们本身所持有的副本进行更改,并尝试将更改写回到共享内存.若是没有其余线程正在更改共享内存,那么cas容许线程将它的更改写回到共享内存中.若是已经有线程在更改共享内存,那么会读取一个新的拷贝,在新的拷贝上进行修改并从新尝试将修改写回到共享内存中.
咱们称之为乐观锁的缘由是线程会获取一份数据拷贝,并基于这份拷贝进行修改,基于乐观的假定,此时没有任何线程在修改共享内存.若是假定成真,那么线程只须要继续更改共享内存便可而不须要锁定任何东西.若是假定不成真,那么这次修改会被做废,但也不会锁定任何东西.
乐观锁,在对共享内存竞争率较低的状况下性能表现较好.若是对共享内存的竞争率比较高的话,线程会浪费大部分CPU运行时钟来作无效的数据拷贝修改和失败的共享内存写入.可是若是你的共享资源比较庞大的话,你须要考虑将你的代码从新设计为对共享内存竟争率较低的状况.
上文示例的乐观锁是非阻塞的.若是一个线程出于未知的缘由对共享内存数据进行拷贝和修改的过程当中发生了阻塞将不会影响其余线程继续访问共享内存.
一个传统锁lock/unlock的状况.当一个线程取得锁实例时会阻塞其余线程直到它释放锁为止.若是一个线程在取得锁后执行临界区代码的过程当中发生阻塞,那么会持有锁一段时间甚至是永远也不会释放.这样其余等待持有该锁的线程也会永远等待下去.
一个简单的cas乐观锁可以在一次cas操做后将共享数据结构整个替换为新的.将整个数据结构替换为一个已经修改过的拷贝并不老是可行的.
想象一下若是共享数据结构是一个队列.每一个线程都会拷贝一份它本身的副本,并尝试在副本上插入和取出元素以达到更改副本的效果.这里能够经过AtomicReference来达到目的.拷贝引用对象即拷贝和修改队列,并尝试将AtomicReference的引用指向新建立的队列.
然而,一个较大的数据结构须要花费更多的CPU运行时间和内存来进行拷贝.这会让你的应用消耗大量的内存和运行时间来进行拷贝.这可能会影响应用的执行,特别是对数据结构竞争比较激烈的状况.更多的,若是线程花费拷贝和修改数据结构的时间越多,那么就越有可能其余线程会在此期间已经对共享内存中的数据结构进行修改.若是线程拷贝的共享数据结构已经被修改过了,全部的线程都须要从新进行它们的拷贝和修改操做.这会对程序的执行性能和内存消耗形成更大的负面影响.
下一节中,将会介绍一个实现可以被并行修改的非阻塞数据结构的方法.
该系列博文为笔者复习基础所著译文或理解后的产物,复习原文来自Jakob Jenkov所著Java Concurrency and Multithreading Tutorial