Java并发编程核心概念一览

时间 2019-11-08

标签 java 并发编程核心概念一览栏目 Java 繁體版

原文原文链接

并行相关概念

同步和异步

同步和异步一般来形容一次方法的调用。同步方法一旦开始，调用者必须等到方法结束才能执行后续动做；异步方法则是在调用该方法后没必要等到该方法执行完就能执行后面的代码，该方法会在另外一个线程异步执行，异步方法老是伴随着回调，经过回调来得到异步方法的执行结果。web

并发和并行

不少人都将并发与并行混淆在一块儿，它们虽然均可以表示两个或者多个任务一块儿执行，但执行过程上是有区别的。并发是多个任务交替执行，多任务之间仍是串行的；而并行是多个任务同时执行，和并发有本质区别。redis

对计算机而言，若是系统内只有一个 CPU ，而使用多进程或者多线程执行任务，那么这种状况下多线程或者多进程就是并发执行，并行只可能出如今多核系统中。固然，对 Java 程序而言，咱们没必要去关心程序是并行仍是并发。spring

临界区

临界区表示的是多个线程共享但同时只能有一个线程使用它的资源。在并行程序中临界区资源是受保护的，必须确保同一时刻只有一个线程能使用它。数据库

阻塞

若是一个线程占有了临界区的资源，其余须要使用这个临界区资源的线程必须在这个临界区进行等待(线程被挂起)，这种状况就是发生了阻塞(线程停滞不前)。编程

死锁\饥饿\活锁

死锁就是多个线程须要其余线程的资源才能释放它所拥有的资源，而其余线程释放这个线程须要的资源必须先得到这个线程所拥有的资源，这样形成了矛盾没法解开；后端

活锁就是两个线程互相谦让资源，结果就是谁也拿不到资源致使活锁；就比如过马路，行人给车让道，车又给行人让道，结果就是车和行人都停在那不走。数组

饥饿就是，某个线程优先级特别低总是拿不到资源，致使这个线程一直没法执行。缓存

并发级别

并发级别分为阻塞，无饥饿，无障碍，无锁，无等待几个级别；根据名字咱们也能大概猜出这几个级别对应的什么情形；阻塞，无饥饿和无锁都好理解；咱们说一下无障碍和无等待；安全

无障碍：无障碍级别默认各个线程不会发生冲突，不会互相抢占资源，一旦抢占资源就认为线程发生错误，进行回滚。springboot

无等待：无等待是在无锁上的进一步优化，限制每一个线程完成任务的步数。

并行的两个定理

加速比：加速比=优化前系统耗时/优化后系统耗时

Amdahl 定理：加速比=1/[F+(1-F)/n] 其中 n 表示处理器个数，F是程序中只能串行执行的比例(串行率)；由公式可知，想要以最小投入，获得最高加速比即 F+(1-F)/n 取到最小值，F 和 n 都对结果有很大影响，在深刻研究就是数学问题了。

Gustafson 定律：加速比=n-F(n-1)，这两定律区别不大，都体现了单纯的减小串行率，或者单纯的加 CPU 都没法获得最优解。

Java 中的并行基础

原子性，可见性，有序性

原子性指的是一个操做是不可中断的，要么成功要么失败，不会被其余线程所干扰；好比 int=1 ,这一操做在 cpu 中分为好几个指令，但对程序而言这几个指令是一体的，只有可能执行成功或者失败，不可能发生只执行了一半的操做；对不一样 CPU 而言保证原子性的的实现方式各有不一样，就英特尔 CPU 而言是使用一个 lock 指令来保证的。

可见性指某一线程改变某一共享变量，其余线程未必会立刻知道。

有序性指对一个操做而言指令是按必定顺序执行的，但编译器为了提升程序执行的速度，会重排程序指令；cpu在执行指令的时候采用的是流水线的形式，上一个指令和下一个指令差一个工步。好比A指令分三个工步：

操做内存a；
操做内存b；
操做内存c；

现假设有个指令 B 操做流程和 A 同样，那么先执行指令 A 再执行指令 B 时间全利用上了，中间没有停顿等待；但若是有三个这样的指令在流水线上执行： a>b>c ， b>e>c ， c>e>a ；这样的指令顺序就会发生等待下降了 CPU 的效率，编译器为了不这种事情发生，会适当优化指令的顺序进行重排。

volatile关键字

volatile 关键字在 Java 中的做用是保证变量的可见性和防止指令重排。

线程的相关操做

建立线程有三种方法

继承Thread类建立线程
实现Runnable接口建立线程
使用Callable和Future建立线程

终止线程的方法

终止线程可调用 stop() 方法，但这个方法是被废弃不建议使用的，由于强制终止一个线程会引发数据的不一致问题。好比一个线程数据写到一半被终止了，释放了锁，其余线程拿到锁继续写数据，结果致使数据发生了错误。终止线程比较好的方法是“让程序本身终止”，好比定义一个标识符，当标识符为 true 的时候直让程序走到终点，这样就能达到“本身终止”的目的。

线程的中断等待和通知

interrupt() 方法能够中断当前程序，object.wait() 方法让线程进入等待队列，object.notify() 随机唤醒等待队列的一个线程， object.notifyAll() 唤醒等待队列的全部线程。object.wait() 必须在 synchronzied 语句中调用；执行wait、notify 方法必须得到对象的监视器，执行结束后释放监视器供其余线程获取。

join

join() 方法功能是等待其余线程“加入”，能够理解为将某个线程并为本身的子线程，等子线程走完或者等子线程走规定的时间，主线程才往下走；join 的本质是调用调用线程对象的 wait 方法，当咱们执行 wait 或者 notify 方法不该该获取线程对象的监听器，由于可能会影响到其余线程的 join。

yield

yield 是线程的“谦让”机制，能够理解为当线程抢到 cpu 资源时，放弃此次资源从新抢占，yield() 是 Thread 里的一个静态方法。

线程组

若是一个多线程系统线程数量众多并且分工明确，那么可使用线程组来分类。

图示代码建立了一个 testGroup 线程组。

守护线程

守护线程是一种特殊线程，它相似 Java 中的异常系统，主要是概念上的分类，与之对应的是用户线程。它功能应该是在后台完成一些系统性的服务；设置一个线程为守护线程应该在线程 start 以前 setDaemon()。

线程优先级

Java 中线程能够有本身的优先级，优先级高的更有优点抢占资源；线程优先级高的不必定能抢占到资源，只是一个几率问题，而对应优先级低的线程可能会发生饥饿。

在 Java 中使用1到10表示线程的优先级，使用setPriority()方法来进行设置，数字越大表明优先级越高。

Java 线程锁

如下分类是从多个同角度来划分，而不是以某一标准来划分，请注意：

阻塞锁：当一个线程得到锁，其余线程就会被阻塞挂起，直到抢占到锁才继续执行，这样会致使 CPU 切换上下文，切换上下文对 CPU 而言是很耗费时间的。
非阻塞锁：当一个线程得到锁，其余线程直接跳过锁资源相关的代码继续执行，就是非阻塞锁。
自旋锁：当一个线程得到锁，其余线程则在不停进行空循环，直到抢到锁，这样作的好处是避免了上下文切换。
可重入锁：也叫作递归锁，当一个线程得到该锁后，能够屡次进入该锁所同步着的代码块。
互斥锁：互斥锁保证了某一时刻只能有一个线程占有该资源。
读写锁：将代码功能分为读和写，读不互斥，写互斥。
公平锁/非公平锁：公平锁就是在等待队列里排最前面的的先得到锁，非公平锁就是谁抢到谁用。
重量级锁/轻量级锁/偏向锁：使用操做系统 “Mutex Lock” 功能来实现锁机制的叫重量级锁，由于这种锁成本高；轻量级锁是对重量级锁的优化，提升性能；偏向锁是对轻量级锁的优化，在无多线程竞争的状况下尽可能减小没必要要的轻量级锁执行路径。

synchronized

属于阻塞锁、互斥锁、非公平锁以及可重入锁，在 JDK1.6 之前属于重量级锁，后来作了优化。

用法：

指定加锁对象
用于静态代码块/方法
用于动态代码块/方法

示例：

当锁加在静态代码块上或者静态方法上或者为 synchronized(xxx.class){} 时，锁做用于整个类，凡是属于这个类的对象的相关都会被上锁，当用于动态方法或者为或者为synchronized (object){}时锁做用于对象；除此以外，synchronized能够保证线程的可见性和有序性。

Lock

Lock 是一个接口，其下有多个实现类。

方法说明：

lock()方法是日常使用得最多的一个方法，就是用来获取锁。若是锁已被其余线程获取，则进行等待。
tryLock()方法是有返回值的，它表示用来尝试获取锁，若是获取成功，则返回true，若是获取失败（即锁已被其余线程获取），则返回false，这个方法还能够设置一个获取锁的等待时长，若是时间内获取不到直接返回。
两个线程同时经过lock.lockInterruptibly()想获取某个锁时，倘若此时线程A获取到了锁，而线程B只有在等待，那么对线程B调用threadB.interrupt()方法可以中断线程B的等待过程。
unLock()方法是用来释放锁。
newCondition()：生成一个和线程绑定的Condition实例，利用该实例咱们可让线程在合适的时候等待，在特定的时候继续执行，至关于获得这个线程的wait和notify方法。

ReentrantLock

ReentrantLock 重入锁，是实现 Lock 接口的一个类，它对公平锁和非公平锁都支持，在构造方法中传入一个 boolean 值，true 时为公平锁，false 时为非公平锁。

Semaphore(信号量)

信号量是对锁的扩展，锁每次只容许一个线程访问一个资源，而信号量却能够指定多个线程访问某个资源，信号量的构造函数为

第一个方法指定了可以使用的线程数，第二个方法的布尔值表示是否为公平锁。

acquire() 方法尝试得到一个许可，若是获取不到则等待；tryAcquire() 方法尝试获取一个许可，成功返回 true，失败返回false，不会阻塞，tryAcquire(int i) 指定等待时间；release() 方法释放一个许可。

ReadWriteLock

读写分离锁，读写分离锁能够有效的减小锁竞争，读锁是共享锁，能够被多个线程同时获取，写锁是互斥只能被一个线程占有，ReadWriteLock 是一个接口，其中 readLock() 得到读锁，writeLock() 得到写锁其实现类 ReentrantReadWriteLock 是一个可重入得的读写锁，它支持锁的降级(在得到写锁的状况下能够再持有读锁)，不支持锁的升级（在得到读锁的状况下不能再得到写锁）；读锁和写锁也是互斥的，也就是一个资源要么被上了一个写锁，要么被上了多个读锁，不会发生这个资即被上写锁又被上读锁的状况。

cas

cas(比较替换)：无锁策略的一种实现方式，过程为获取到变量旧值（每一个线程都有一份变量值的副本），和变量目前的新值作比较，若是同样证实变量没被其余线程修改过，这个线程就能够更新这个变量，不然不能更新；通俗的说就是经过不加锁的方式来修改共享资源并同时保证安全性。

使用cas的话对于属性变量不能再用传统的 int ,long 等；要使用原子类代替原先的数据类型操做，好比 AtomicBoolean，AtomicInteger，AtomicInteger 等。

并发下集合类

并发集合类主要有：

ConcurrentHashMap：支持多线程的分段哈希表，它经过将整个哈希表分红多段的方式减少锁粒度。
ConcurrentSkipListMap：ConcurrentSkipListMap的底层是经过跳表来实现的。跳表是一个链表，可是经过使用“跳跃式”查找的方式使得插入、读取数据时复杂度变成了O（logn）。
ConCurrentSkipListSet：参考 ConcurrentSkipListMap。
CopyOnWriteArrayList：是 ArrayList 的一个线程安全的变形，其中全部可变操做（添加、设置，等等）都是经过对基础数组进行一次新的复制来实现的。
CopyOnWriteArraySet：参考 CopyOnWriteArrayList。
ConcurrentLinkedQueue：cas 实现的非阻塞并发队列。

线程池

介绍

多线程的设计优势是能很大限度的发挥多核处理器的计算能力，可是，若不控制好线程资源反而会拖累cpu，下降系统性能，这就涉及到了线程的回收复用等一系列问题；并且自己线程的建立和销毁也很耗费资源，所以找到一个合适的方法来提升线程的复用就很必要了。

线程池就是解决这类问题的一个很好的方法：线程池中自己有不少个线程，当须要使用线程的时候拿一个线程出来，当用完则还回去，而不是每次都建立和销毁。在 JDK 中提供了一套 Executor 线程池框架，帮助开发人员有效的进行线程控制。

Executor 使用

得到线程池的方法：

newFixedThreadPool(int nThreads) ：建立固定数目线程的线程池。
newCachedThreadPool：建立一个可缓存的线程池，调用execute将重用之前构造的线程（若是线程可用）。若是现有线程没有可用的，则建立一个新线程并添加到池中。
newSingleThreadExecutor：建立一个单线程化的 Executor。
newScheduledThreadPool：建立一个支持定时及周期性的任务执行的线程池。

以上方法都是返回一个 ExecutorService 对象，executorService.execute() 传入一个 Runnable 对象，可执行一个线程任务。

下面看示例代码

ScheduledExecutorService

newScheduledThreadPool(int corePoolSize) 会返回一个ScheduledExecutorService 对象，能够根据时间对线程进行调度；其下有三个执行线程任务的方法：schedule()，scheduleAtFixedRate() 以及 scheduleWithFixedDelay() 该线程池可解决定时任务的问题。

示例：

job1的执行方式是任务发起后间隔 wait 秒开始执行，每隔 period 秒(注意：不包括上一个线程的执行时间)执行一次；

job2的执行方式是任务发起后间隔 wait 秒开始执行，等线程结束后隔 period 秒开始执行下一个线程；

job3只执行一次，延迟 wait 秒执行；

ScheduledExecutorService 还能够配合 Callable 使用来回调得到线程执行结果，还能够取消队列中的执行任务等操做，这属于比较复杂的用法，咱们这里掌握基本的便可，到实际遇到相应的问题时咱们在现学现用，节省学习成本。

锁优化

减少锁持有时间

减少锁的持有时间可有效的减小锁的竞争。若是线程持有锁的时间越长，那么锁的竞争程度就会越激烈。所以，应尽量减小线程对某个锁的占有时间，进而减小线程间互斥的可能。

减小锁持有时间的方法有：

进行条件判断，只对必要的状况进行加锁，而不是整个方法加锁。
减小加锁代码的行数，只对必要的步骤加锁。

减少锁粒度

减少锁的范围，减小锁住的代码行数可减小锁范围，减少共享资源的范围也可减少锁的范围。减少锁共享资源的范围的方式比较常见的有分段锁，好比 ConcurrentHashMap ，它将数据分为了多段，当须要 put 元素的时候，并非对整个 hashmap 进行加锁，而是先经过 hashcode 来知道他要放在那一个分段中，而后对这个分段进行加锁，因此当多线程 put 的时候，只要不是放在一个分段中，就实现了真正的并行的插入。

锁分离

锁分离最多见的操做就是读写分离了，读写分离的操做参考 ReadWriteLock 章节，而对读写分离进一步的延伸就是锁分离了。为了提升线程的并行量，咱们能够针对不一样的功能采用不一样的锁，而不是通通用同一把锁。好比说有一个同步方法未进行锁分离以前，它只有一把锁，任何线程来了，只有拿到锁才有资格运行，进行锁分离以后就不是这种情形了——来一个线程，先判断一下它要干吗，而后发一个对应的锁给它，这样就能必定程度上提升线程的并行数。

锁粗化

通常为了保证多线程间的有效并发，会要求每一个线程持有锁的时间尽可能短，也就是说锁住的代码尽可能少。可是若是若是对同一个锁不停的进行请求、同步和释放，其自己也会消耗系统宝贵的资源，反而不利于性能的优化。好比有三个步骤：a、b、c，a同步，b不一样步，c同步；那么一个线程来时候会上锁释放锁而后又上锁释放锁。这样反而可能会下降线程的执行效率，这个时候咱们将锁粗化可能会更好——执行 a 的时候上锁，执行完 c 再释放锁。

锁扩展

分布式锁

JDK 提供的锁在单体项目中不会有什么问题，可是在集群项目中就会有问题了。在分布式模型下，数据只有一份（或有限制），此时须要利用锁的技术控制某一时刻修改数据的进程数。JDK 锁显然没法知足咱们的需求，因而就有了分布式锁。

分布式锁的实现有三种方式：
- 基于数据库实现分布式锁
- 基于缓存（redis，memcached，tair）实现分布式锁
- 基于 Zookeeper 实现分布式锁
基于redis的分布式锁比较使用广泛，在这里介绍其原理和使用：

redis 实现锁的机制是 setnx 指令，setnx 是原子操做命令，锁存在不能设置值，返回 0 ；锁不存在，则设置锁，返回 1 ，根据返回值来判断上锁是否成功。看到这里你可能想为啥不先 get 有没有值，再 set 上锁；首先咱们要知道，redis 是单线程的，同一时刻只可能有一个线程操做内存，而后 setnx 是一个操做步骤(具备原子性)，而 get 再 set 是两个步骤（不具备原子性）。若是使用第二种可能会发生这种状况：客户端 a get发现没有锁，这个时候被切换到客户端b，b get也发现没锁，而后b set，这个时候又切换到a客户端 a set；这种状况下，锁彻底没起做用。因此，redis分布式锁，原子性是关键。

对于 web 应用中 redis 客户端用的比较多的是 lettuce，jedis，redisson。springboot 的 redis 的 start 包底层是 lettuce ，但对 redis 分布式锁支持得最好的是 redisson（若是用 redisson 你就享受不到 redis 自动化配置的好处了）；不过 springboot 的 redisTemplete 支持手写 lua 脚本，咱们能够经过手写 lua 脚原本实现 redis 锁。

数据库锁

对于存在多线程问题的项目，好比商品货物的进销存，订单系统单据流转这种，咱们能够经过代码上锁来控制并发，也可使用数据库锁来控制并发，数据库锁从机制上来讲分乐观锁和悲观锁。

悲观锁：

悲观锁分为共享锁（S锁）和排他锁（X锁），MySQL 数据库读操做分为三种——快照读，当前读；快照读就是普通的读操做当前读就是对数据库上悲观锁了；其中 select...lockinshare mode 属于共享锁，多个事务对于同一数据能够共享，但只能读不能修改。而下面三种 SQL :

属于排他锁，排他锁就是不能与其余锁并存，如一个事务获取了一个数据行的排他锁，其余事务就不能再获取该行的其余锁，包括共享锁和排他锁，可是获取排他锁的事务是能够对数据行读取和修改，排他锁是阻塞锁。
乐观锁：

就是很乐观，每次去拿数据的时候都认为别人不会修改，因此不会上锁，可是在更新的时候会判断一下在此期间别人有没有去更新这个数据，若是有则更新失败。一种实现方式为在数据库表中加一个版本号字段 version ，任何 update 语句 where 后面都要跟上 version=？，而且每次 update 版本号都加 1。若是 a 线程要修改某条数据，它须要先 select 快照读得到版本号，而后 update ，同时版本号加一。这样就保证了在 a 线程修改某条数据的时候，确保其余线程没有修改过这条数据，一旦其余线程修改过，就会致使 a 线程版本号对不上而更新失败（这实际上是一个简化版的mvcc）。

乐观锁适用于容许更新失败的业务场景，悲观锁适用于确保更新操做被执行的场景。

并发编程相关
- 善用 Java8 Stream
- 对于生产者消费者模式，条件判断是使用 while 而不是 if
- 懒汉单例采用双重检查和锁保证线程安全
- 善用 Future 模式
- 合理使用 ThreadLocal
Java 8 引入 lambda 表达式使在 Java 中使用函数式编程很方便。而 Java 8 中的 stream 对数据的处理能使线程执行速度得以优化。Future 模式是一种对异步线程的回调机制；如今 cpu 都是多核的，咱们在处理一些较为费时的任务时可以使用异步，在后台开启多个线程同时处理，等到异步线程处理完再经过 Future 回调拿处处理的结果。

ThreadLocal 的实例表明了一个线程局部的变量，每条线程都只能看到本身的值，并不会意识到其它的线程中也存在该变量(这里原理就不说了，网上资料不少)，总之就是咱们若是想在多线程的类里面使用线程安全的变量就用 ThreadLocal ，可是请必定要注意用完记得 remove ，否则会发生内存泄漏。

总结

随着后端发展，如今单体项目愈来愈少，基本上都是集群和分布式，这样也使得 JDK 的锁慢慢变得无用武之地。可是万变不离其宗，虽然锁的实现方式变了，但其机制是没变的；不管是分布式锁仍是 JDK 锁，其目的和处理方式都是一个机制，只是处理对象不同而已。