简书江溢Jonny,转载请注明原创出处,谢谢!java
本文基于JDK1.7的源码进行分析并解读。咱们将以一个简单的案例开始本话题的讨论,而且在文章的结尾,笔者将会给出一些经验之谈,避免后来者踩坑。编程
若是你喜欢我,能够关注个人公众号~更多干货~ 缓存
ThreadPoolExecutor是JUC提供的一类线程池工具,也是Java语言中应用场景最多的并发框架,能够说,几乎全部须要异步或者并发执行的,均可以使用Java线程池。那么首先,咱们一块儿来比较一下“单纯使用线程的方案”和“使用ThreadPoolExecutor线程池的方案”,在解决问题上有什么区别吧。安全
在中世纪,有一种叫作抄写员(Scribe)的工做,他们的职责就好像是复印机,抄写一本又一本书。假如这个时候有一个抄写员工做室,只有2个抄写员,他们要抄写10本书。bash
咱们在本例中分别“本身写线程管理”和“由ThreadPoolExecutor作线程管理”服务器
public static class Book {
private static AtomicInteger id = new AtomicInteger(0); // 书名生成器
private String bookName; // 书名
public void copy() { // 抄写书籍
System.out.println("start copy " + bookName);
try {
Thread.sleep(100L); // sleep 100ms
} catch (Exception e) {
// ignore
}
System.out.println("end copy " + bookName);
}
public Book() {
bookName = "book-" + String.valueOf(id.incrementAndGet()); // 书名自动生成
}
}
复制代码
// 提早准备好十本书
final BlockingQueue<Book> books = new LinkedBlockingDeque<Book>(10);
for (int i = 0; i < 10; i++) {
try {
books.put(new Book());
} catch (Exception e) {
// ignore
}
}
System.out.println("start work...");
// 建立两个书籍抄写员线程
Thread[] scribes = new Thread[2];
for (int scribeIndex = 0; scribeIndex < 2; scribeIndex++) {
scribes[scribeIndex] = new Thread(new Runnable() {
public void run() {
for (; ; ) {
if (Thread.currentThread().isInterrupted()) {
System.out.println("time arrives, stop writing...");
}
try {
Book currentBook = books.poll(5, TimeUnit.SECONDS);
currentBook.copy();
} catch (Exception e) {
System.out.println("time arrives, stop writing...");
return;
}
}
}
});
scribes[scribeIndex].setDaemon(false); // 设置为非守护线程
scribes[scribeIndex].start();
}
// 工做已经安排下去了,安心等待就行了
try {
Thread.sleep(10000l);
} catch (Exception e) {
// ignore
}
// 时间到了,提醒两个抄写员中止抄写
for (int scribeIndex = 0; scribeIndex < 2; scribeIndex++) {
scribes[scribeIndex].interrupt();
}
System.out.println("end work...");
复制代码
写了一大堆代码来完成上述的功能,让咱们一块儿来看看用了ThreadPoolExecutor是怎么完成的。并发
System.out.println("start work...");
ExecutorService executorService = Executors.newFixedThreadPool(2);
for (int i = 0; i < 10; i ++) {
executorService.submit(new Runnable() {
public void run() {
new Book().copy();
}
});
}
// 工做已经安排下去了,安心等待就行了
try {
Thread.sleep(10000l);
} catch (Exception e) {
// ignore
}
executorService.shutdownNow();
System.out.println("end work...");
复制代码
整个流程很是清晰,分别是:任务编写、线程建立、线程启动、终止线程。框架
可是不少时候,问题并不只限于上述的内容。异步
最先的并发编程的开发者不少事情都须要亲力亲为,而经过使用Java线程池,能够完成如下工做:函数
1)线程管理,线程的建立、启动、销毁等工做;
2)线程复用,线程的建立是会给服务器带来必定开销的,如何减小频繁重复建立线程的开销;
3)弹性伸缩,服务器一般有高峰期也有低峰期,线程池是否能够弹性伸缩,好比线程建立成功后长时间不使用是否能够回收,以减小系统资源的浪费,或者线程池的容量是否能够随时增加;
4)拒绝策略,线程数量有限而须要处理的任务不少,超出系统承载范围的任务是拒绝仍是阻塞等待;
5)异常处理,线程在执行过程当中可能遇到异常或者错误,开发者如何正确应对这些异常或者错误;
6)任务分配,任务的分配是基于先入先出仍是基于某种优先级的策略。
等等如是,不一而足,这个时候咱们就要介绍Doug Lea大神开发的ThreadPoolExecutor线程池框架,看看大神是怎么解决上面这些问题的。
首先,在解读源码以前,要引入ThreadPoolExecutor的一些重要概念
在ThreadPoolExecutor线程池的设计中,把整个任务执行框架线程池划分为5个生命周期:
RUNNING:容许接收新任务而且处理队列中的任务
SHUTDOWN:再也不接收新的任务,仅消化完队列中的任务
STOP:不只再也不接收新的任务,连队列中的任务都再也不消化处理了,而且尝试中断正在执行任务的线程
TIDYING:全部任务被终止了,工做线程数workCount
也被设为0,线程的状态也被设为TIDYING,并开始调用钩子函数terminated()
TERMINATED:钩子函数terminated()
执行完毕
各个生命周期的转化图以下:
从图中能够看到,整个生命周期的变化是不可逆的。
ThreadPoolExecutor把线程池状态和线程池容量打包成一个int型变量,以下图所示
线程池状态位
状态 | 高位值枚举 | 正负性 |
---|---|---|
RUNNING | 111 | 负数(-536870912) |
SHUTDOWN | 000 | 0 |
STOP | 001 | 正数(536870912) |
TIDYING | 010 | 正数(1073741824) |
TERMINATED | 011 | 正数(1610612736) |
所以在状态值的排布上能够知道 TERMINATED > TIDYING > STOP >SHUTDOWN > RUNNING
ThreadPoolExecutor中的代码以下所示:
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
private static final int COUNT_BITS = Integer.SIZE - 3;
private static final int CAPACITY = (1 << COUNT_BITS) - 1;
// 状态字的高比特位存放线程池状态信息
private static final int RUNNING = -1 << COUNT_BITS;
private static final int SHUTDOWN = 0 << COUNT_BITS;
private static final int STOP = 1 << COUNT_BITS;
private static final int TIDYING = 2 << COUNT_BITS;
private static final int TERMINATED = 3 << COUNT_BITS;
// 打包/提取状态字信息
private static int runStateOf(int c) { return c & ~CAPACITY; }
private static int workerCountOf(int c) { return c & CAPACITY; }
// 判断当前线程池是否正在执行
private static boolean isRunning(int c) {
return c < SHUTDOWN;
}
复制代码
首先,咱们建立一个线程池。
ExecutorService executorService = Executors.newFixedThreadPool(2);
复制代码
这里使用了Executors提供的工厂方法,能够建立如下四种类型线程池:
newFixedThreadPool。该方法将用于建立一个固定大小的线程池(此时corePoolSize = maxPoolSize),每提交一个任务就建立一个线程池,直到线程池达到最大数量,线程池的规模在此后不会发生任何变化;
newCachedThreadPool。该方法建立了一个可缓存的线程池,(此时corePoolSize = 0,maxPoolSize = Integer.MAX_VALUE),空闲线程超过60秒就会被自动回收,该线程池存在的风险是,若是服务器应用达到请求高峰期时,会不断建立新的线程,直到内存耗尽;
newSingleThreadExecutor。该方法建立了一个单线程的线程池,该线程池按照任务在队列中的顺序串行执行(如:FIFO、LIFO、优先级);
newScheduledThreadPool。该方法建立了一个固定长度的线程池,能够以延迟或者定时的方式执行任务;
任务提交的大概逻辑以下:
1)当线程池小于corePoolSize时,新提交任务将建立一个新线程执行任务,即便此时线程池中存在空闲线程;
2)当线程池达到corePoolSize时,新提交任务将被放入workQueue中,等待线程池中任务调度执行;
3)当workQueue已满,且maximumPoolSize > corePoolSize时,新提交任务会建立新线程执行任务;
4)当提交任务数超过maximumPoolSize时,新提交任务由RejectedExecutionHandler处理;
5)当线程池中超过corePoolSize线程,空闲时间达到keepAliveTime时,关闭空闲线程;
那么接下来咱们看看源代码是怎么实现上面的描述的
线程池建立成功之后,咱们提交任务到线程池中:
executorService.submit(new Runnable() {
public void run() {
new Book().copy();
}
});
复制代码
submit到线程池之后:
public <T> Future<T> submit(Runnable task, T result) {
if (task == null) throw new NullPointerException();
RunnableFuture<T> ftask = newTaskFor(task, result);// 包装出一个新的任务
execute(ftask); // 线程池的入口
return ftask;
}
复制代码
能够看到ThreadPoolExecutor
的入口方法就是execute(Runnable commad)
。该方法的执行逻辑以下:
int c = ctl.get();
// 1. 若是当前线程池中线程总数少于核心线程数,则添加新线程到线程池中,
// 而且由新线程执行刚提交进来的任务
if (workerCountOf(c) < corePoolSize) {
if (addWorker(command, true))
return;
c = ctl.get();
}
if (isRunning(c) && workQueue.offer(command)) {
int recheck = ctl.get();
// 2. 可能刚才在建立新线程成功的同时,线程池被关闭了,所以须要double-check,
// 若是此时线程池已经被关闭了,那么回滚刚才被添加进来的任务
if (! isRunning(recheck) && remove(command))
reject(command);
else if (workerCountOf(recheck) == 0)
addWorker(null, false);
}
// 3. 若是此时核心线程数(corePoolSize)已经满了,而且任务队列也满了,
// 尝试增长线程到maximumPoolSize大小,若是仍然失败,执行拒绝策略
else if (!addWorker(command, false))
reject(command);
复制代码
在上面的代码里面,ctl.get()
方法、workerCountOf()
、以及isRunning()
方法都是对以前提到的状态字进行读写的操做,这部分咱们就再也不展开给读者看了,有兴趣的读者能够本身了解一下。
接下来,咱们看看addWorker都作了什么工做:
private boolean addWorker(Runnable firstTask, boolean core) {
// 这部分省略的代码都是对状态字进行修改,添加并建立线程以前,
// 须要递增work记数(此时须要线程安全地操做)
...
boolean workerStarted = false;
boolean workerAdded = false;
Worker w = null;
try {
...
w = new Worker(firstTask); // 此处封装出了一个新的Work,这个类咱们稍后会介绍
final Thread t = w.thread;
if (t != null) {
...
// 得到线程池状态,若是线程池已经被关闭了,则再也不建立新的线程
int c = ctl.get();
int rs = runStateOf(c);
if (rs < SHUTDOWN ||
(rs == SHUTDOWN && firstTask == null)) {
if (t.isAlive()) // precheck that t is startable
throw new IllegalThreadStateException();
workers.add(w);
int s = workers.size();
...
workerAdded = true;
...
if (workerAdded) {
t.start();
workerStarted = true;
}
}
} finally {
if (! workerStarted)
// 若是任务启动或者提交到线程池失败,
// 则执行回滚操做(从工做线程池中移除失败添加的worker、减小状态字中的任务计数)
addWorkerFailed(w);
}
return workerStarted;
}
复制代码
任务执行在Worker
类中,而Worker
类是一个继承了Runnable
接口的类。
private final class Worker extends AbstractQueuedSynchronizer implements Runnable {
...
public void run() {
runWorker(this);
}
...
}
复制代码
能够看到Worker类中调用了外部的runWorker()
方法。所以能够了解到,任务执行的主要逻辑,就是在外部的runWorker()
方法中执行的
final void runWorker(Worker w) {
Thread wt = Thread.currentThread();
Runnable task = w.firstTask;
w.firstTask = null;
...
boolean completedAbruptly = true;
try {
while (task != null || (task = getTask()) != null) { // 循环读取任务
...
try {
beforeExecute(wt, task); // 用户实现的回调方法,任务启动前
Throwable thrown = null;
try {
task.run();// 任务执行
} catch (RuntimeException x) {
thrown = x; throw x;
} catch (Error x) {
thrown = x; throw x;
} catch (Throwable x) {
thrown = x; throw new Error(x);
} finally {
afterExecute(task, thrown); // 用户实现的回调方法,任务执行后
}
} finally {
task = null;
w.completedTasks++;
...
}
}
completedAbruptly = false;
} finally {
processWorkerExit(w, completedAbruptly);
}
}
复制代码
beforeExecute和afterExecute是两个钩子方法,在里面指定了当线程开始执行和完成执行之后执行的动做,须要开发者实现。
另外须要注意的还有runWorker方法内调用的getTask()方法,在该方法内部,若是发生如下状况将会返回null,终止工做线程的执行循环: 1)当前线程数即将超过maxPoolSize 2)线程池被关闭 3)当前线程数大于corePoolSize且小于maxPoolSize,并关切从BlockingQueue取数据超过了超时时间(默认60秒)
代码实现以下:
private Runnable getTask() {
boolean timedOut = false; // Did the last poll() time out?
retry:
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
// 校验当前线程池状态
if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
decrementWorkerCount();
return null;
}
boolean timed; // Are workers subject to culling?
for (;;) {
int wc = workerCountOf(c);
timed = allowCoreThreadTimeOut || wc > corePoolSize;
if (wc <= maximumPoolSize && ! (timedOut && timed))
break;
if (compareAndDecrementWorkerCount(c))
return null;
c = ctl.get(); // Re-read ctl
if (runStateOf(c) != rs)
continue retry;
// else CAS failed due to workerCount change; retry inner loop
}
try {
// 若是线程超过指定时间内(默认60秒)没有获取到任务,说明有线程即将过时
Runnable r = timed ?
workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
workQueue.take();
if (r != null)
return r;
timedOut = true;
} catch (InterruptedException retry) {
timedOut = false;
}
}
}
复制代码
若是线程被提交到线程池时,当前线程池出现如下状况的任一一种状况: 1)线程池任务队列已经满了 2)线程池被关闭了(调用了shutdown
函数或者shutdownNow
函数) 都将会调用提早设置好的回调策略,ThreadPoolExecutor
中总共提供了四种策略:
1)AbortPolicy(停止):该策略将会直接抛出RejectedExecutionException异常,调用者将会得到异常;
2)DiscardPolicy(抛弃):使用该策略,线程池将会悄悄地丢弃这个任务而不被调用者知道;
3)CallerRunsPolicy(调用者运行):该策略既不会抛弃任务也不会抛出异常,而是将这个任务退回给调用者,从而下降新任务的流量;
4)DiscardOldestPolicy(抛弃最旧的):该策略将会抛弃下一个即将轮到执行的任务,那么“抛弃最旧”的将致使抛弃优先级最高的任务,所以最好不要把“抛弃最旧的”饱和策略和优先级队列放在一块儿使用; 这里,代码实现咱们将只展现**CallerRunsPolicy(调用者运行)**策略:
public static class CallerRunsPolicy implements RejectedExecutionHandler {
/** * Creates a {@code CallerRunsPolicy}. */
public CallerRunsPolicy() { }
// 策略实现
public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
if (!e.isShutdown()) {
r.run();
}
}
}
复制代码
固然开发者也能够选择,根据业务需求,定义本身的饱和策略。
ThreadPoolExecutor
提供了两种方法销毁线程池,分别是shutdown()
和shutdownNow()
shutdown()
方法仅仅是把线程池的状态置为SHUTDOWN,而且拒绝以后尝试提交进来的全部请求,可是已经在任务队列里的任务会仍然会正常消费。
而shutdownNow()
方法的表现显得更加简单粗暴,它会强行关闭ExecutorService
,也会尝试取消正在执行的任务,而且返回全部已经提交但还没有开始的任务,开发者能够将这些任务写入日志保存起来以便以后进行处理,另外尝试取消正在执行的任务仅仅是尝试对执行线程进行中断,具体的线程响应中断策略须要用户本身编写。代码实现以下:
public List<Runnable> shutdownNow() {
List<Runnable> tasks;
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
checkShutdownAccess();
advanceRunState(STOP);
interruptWorkers();
tasks = drainQueue();
} finally {
mainLock.unlock();
}
tryTerminate();
return tasks;
}
复制代码
不要在ThreadPoolExecutor
线程池中使用ThreadLocal
,由于在ThreadPoolExecutor
中,线程是复用的,所以在这里使用ThreadLocal
会被多个task共享,所以可能会带来脏数据污染。须要当心使用
以一段代码为例:
// 10个线程,由于任务多,这里用LinkedBlockingQueue
private static final LinkedBlockingQueue<Runnable> queue = new LinkedBlockingQueue<Runnable>();
private static final ExecutorService service = new ThreadPoolExecutor(0, 10,
60L, TimeUnit.SECONDS, queue
);
复制代码
代码中的corePoolSize=0,也就是核心线程数是1,若是任务数多于10个,那么会先建立maximumPoolSize个线程执行,其他的任务加入 queue 中等待执行。
而在ThreadPoolExecutor
的实现中,当workQueue已满,且maximumPoolSize>corePoolSize时,新提交任务会建立新线程执行任务。
所以,queue 是不会满的,那么永远不会有maximumPoolSize个线程被建立,也就是说咱们的任务一直仍是一个线程在跑,没法达到能够同时使用多个线程的预期。
虽然ThreadPoolExecutor
提供了shutdownNow()
方法,在调用该方法后会尝试中断全部线程,可是该中断并不能保证线程必定会就此终止,所以,须要开发者实现线程中断的策略。关于这部分的内容,在Doug Lea的《Java Concurrency In Practice》的7.1.2节已经进行了完整的讨论,笔者在这里就再也不赘述了。
尤为须要注意的是,ThreadPoolExecutor
有一个finalize
函数,具体实现以下:
protected void finalize() {
shutdown();
}
复制代码
在该方法中调用了shutdown()
函数,所以,若是你并非真正但愿中止线程池的执行,那么就不要让线程池离开你代码的做用范围。
我是江溢Jonny。