继承结构看起来很清晰,最顶层的Executor只提供了一个最简单的void execute(Runnable command)方法,而后是ExecutorService,ExecutorService提供了一些管理相关的方法,例如关闭、判断当前线程池的状态等,另外不一样于Executor#execute,ExecutorService提供了一系列方法,能够将任务包装成一个Future,从而使得任务提交方能够跟踪任务的状态。而父类AbstractExecutorService则提供了一些默认的实现。安全
ThreadPoolExecutor的构造器提供了很是多的参数,每个参数都很是的重要,一不当心就容易踩坑,所以设置的时候,你必需要知道本身在干什么。性能优化
public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, ThreadFactory threadFactory, RejectedExecutionHandler handler) { if (corePoolSize < 0 || maximumPoolSize <= 0 || maximumPoolSize < corePoolSize || keepAliveTime < 0) throw new IllegalArgumentException(); if (workQueue == null || threadFactory == null || handler == null) throw new NullPointerException(); this.acc = System.getSecurityManager() == null ? null : AccessController.getContext(); this.corePoolSize = corePoolSize; this.maximumPoolSize = maximumPoolSize; this.workQueue = workQueue; this.keepAliveTime = unit.toNanos(keepAliveTime); this.threadFactory = threadFactory; this.handler = handler; }
看完这几个参数的含义,咱们看一下Executors提供的一些工具方法,只要是为了方便使用,可是我建议最好少用这个类,而是直接用ThreadPoolExecutor的构造函数,多了解一下这几个参数究竟是什么意思,本身的业务场景是什么样的,好比线程池需不须要扩容、用不用回收空闲的线程等。多线程
public class Executors { /* * 提供一个固定大小的线程池,而且线程不会回收,因为传入的是一个无界队列,至关于队列永远不会满 * 也就不会扩容,所以须要特别注意任务积压在队列中致使内存爆掉的问题 */ public static ExecutorService newFixedThreadPool(int nThreads) { return new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>()); } /* * 这个线程池会一直扩容,因为SynchronousQueue的特性,若是当前全部的线程都在处理任务,那么 * 新的请求过来,就会致使建立一个新的线程处理任务。若是线程一分钟没有新任务处理,就会被回 * 收掉。特别注意,若是每个任务都比较耗时,并发又比较高,那么可能每次任务过来都会建立一个线 * 程 */ public static ExecutorService newCachedThreadPool() { return new ThreadPoolExecutor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS, new SynchronousQueue<Runnable>()); } }
既然是个线程池,那就必然有其生命周期:运行中、关闭、中止等。ThreadPoolExecutor是用一个AtomicInteger去的前三位表示这个状态的,另外又重用了低29位用于表示线程数,能够支持最大大概5亿多,绝逼够用了,若是之后硬件真的发展到可以启动这么多线程,改为AtomicLong就能够了。架构
状态这里主要分为下面几种:并发
同时咱们能够看到全部的状态都是用二进制位表示的,而且依次递增,从而方便进行比较,好比想获取当前状态是否至少为SHUTDOWN等,同时状态以前有几种转换:框架
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0)); private static final int COUNT_BITS = Integer.SIZE - 3; private static final int CAPACITY = (1 << COUNT_BITS) - 1; private static final int RUNNING = -1 << COUNT_BITS; private static final int SHUTDOWN = 0 << COUNT_BITS; private static final int STOP = 1 << COUNT_BITS; private static final int TIDYING = 2 << COUNT_BITS; private static final int TERMINATED = 3 << COUNT_BITS; //因为前三位表示状态,所以将CAPACITY取反,和进行与操做便可 private static int runStateOf(int c) { return c & ~CAPACITY; } private static int workerCountOf(int c) { return c & CAPACITY; } //高三位+第三位进行或操做便可 private static int ctlOf(int rs, int wc) { return rs | wc; } private static boolean runStateLessThan(int c, int s) { return c < s; } private static boolean runStateAtLeast(int c, int s) { return c >= s; } private static boolean isRunning(int c) { return c < SHUTDOWN; } //下面三个方法,经过CAS修改worker的数目 private boolean compareAndIncrementWorkerCount(int expect) { return ctl.compareAndSet(expect, expect + 1); } //只尝试一次,失败了则返回,是否重试由调用方决定 private boolean compareAndDecrementWorkerCount(int expect) { return ctl.compareAndSet(expect, expect - 1); } //跟上一个不同,会一直重试 private void decrementWorkerCount() { do {} while (! compareAndDecrementWorkerCount(ctl.get())); }
下面是比较核心的字段,这里workers采用的是非线程安全的HashSet,而不是线程安全的版本,主要是由于这里有些复合的操做,好比说将worker添加到workers后,咱们还须要判断是否须要更新largestPoolSize等,workers只在获取到mainLock的状况下才会进行读写,另外这里的mainLock也用于在中断线程的时候串行执行,不然若是不加锁的话,可能会形成并发去中断线程,引发没必要要的中断风暴。分布式
private final ReentrantLock mainLock = new ReentrantLock(); private final HashSet<Worker> workers = new HashSet<Worker>(); private final Condition termination = mainLock.newCondition(); private int largestPoolSize; private long completedTaskCount;
拿到一个线程池以后,咱们就能够开始提交任务,让它去执行了,那么咱们看一下submit方法是如何实现的。函数
public Future<?> submit(Runnable task) { if (task == null) throw new NullPointerException(); RunnableFuture<Void> ftask = newTaskFor(task, null); execute(ftask); return ftask; } public <T> Future<T> submit(Callable<T> task) { if (task == null) throw new NullPointerException(); RunnableFuture<T> ftask = newTaskFor(task); execute(ftask); return ftask; }
这两个方法都很简单,首先将提交过来的任务(有两种形式:Callable、Runnable)都包装成统一的RunnableFuture,而后调用execute方法,execute能够说是线程池最核心的一个方法。微服务
public void execute(Runnable command) { if (command == null) throw new NullPointerException(); int c = ctl.get(); /* 获取当前worker的数目,若是小于corePoolSize那么就扩容, 这里不会判断是否已经有core线程,而是只要小于corePoolSize就会直接增长worker */ if (workerCountOf(c) < corePoolSize) { /* 调用addWorker(Runnable firstTask, boolean core)方法扩容 firstTask表示为该worker启动以后要执行的第一个任务,core表示要增长的为core线程 */ if (addWorker(command, true)) return; //若是增长失败了那么从新获取ctl的快照,好比可能线程池在这期间关闭了 c = ctl.get(); } /* 若是当前线程池正在运行中,而且将任务丢到队列中成功了, 那么就会进行一次double check,看下在这期间线程池是否关闭了, 若是关闭了,好比处于SHUTDOWN状态,如上文所讲的,SHUTDOWN状态的时候, 再也不接受新任务,remove成功后调用拒绝处理器。而若是仍然处于运行中的状态, 那么这里就double check下当前的worker数,若是为0,有可能在上述逻辑的执行 过程当中,有worker销毁了,好比说任务抛出了未捕获异常等,那么就会进行一次扩容, 但不一样于扩容core线程,这里因为任务已经丢到队列中去了,所以就不须要再传递firstTask了, 同时要注意,这里扩容的是非core线程 */ if (isRunning(c) && workQueue.offer(command)) { int recheck = ctl.get(); if (! isRunning(recheck) && remove(command)) reject(command); else if (workerCountOf(recheck) == 0) addWorker(null, false); } else if (!addWorker(command, false)) /* 若是在上一步中,将任务丢到队列中失败了,那么就进行一次扩容, 这里会将任务传递到firstTask参数中,而且扩容的是非core线程, 若是扩容失败了,那么就执行拒绝策略。 */ reject(command); }
这里要特别注意下防止队列失败的逻辑,不一样的队列丢任务的逻辑也不同,例如说无界队列,那么就永远不会put失败,也就是说扩容也永远不会执行,若是是有界队列,那么当队列满的时候,会扩容非core线程,若是是SynchronousQueue,这个队列比较特殊,当有另一个线程正在同步获取任务的时候,你才能put成功,所以若是当前线程池中全部的worker都忙着处理任务的时候,那么后续的每次新任务都会致使扩容,固然若是worker没有任务处理了,阻塞在获取任务这一步的时候,新任务的提交就会直接丢到队列中去,而不会扩容。高并发
上文中屡次提到了扩容,那么咱们下面看一下线程池具体是如何进行扩容的:
private boolean addWorker(Runnable firstTask, boolean core) { retry: for (;;) { int c = ctl.get(); //获取当前线程池的状态 int rs = runStateOf(c); /* 若是状态为大于SHUTDOWN, 好比说STOP,STOP上文说过队列中的任务不处理了,也不接受新任务, 所以能够直接返回false不扩容了,若是状态为SHUTDOWN而且firstTask为null,同时队列非空, 那么就能够扩容 */ if (rs >= SHUTDOWN && ! (rs == SHUTDOWN && firstTask == null && ! workQueue.isEmpty())) return false; for (;;) { int wc = workerCountOf(c); /* 若worker的数目大于CAPACITY则直接返回, 而后根据要扩容的是core线程仍是非core线程,进行判断worker数目 是否超过设置的值,超过则返回 */ if (wc >= CAPACITY || wc >= (core ? corePoolSize : maximumPoolSize)) return false; /* 经过CAS的方式自增worker的数目,成功了则直接跳出循环 */ if (compareAndIncrementWorkerCount(c)) break retry; //从新读取状态变量,若是状态改变了,好比线程池关闭了,那么就跳到最外层的for循环, //注意这里跳出的是retry。 c = ctl.get(); // Re-read ctl if (runStateOf(c) != rs) continue retry; // else CAS failed due to workerCount change; retry inner loop } } boolean workerStarted = false; boolean workerAdded = false; Worker w = null; try { //建立Worker w = new Worker(firstTask); final Thread t = w.thread; if (t != null) { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { /* 获取锁,并判断线程池是否已经关闭 */ int rs = runStateOf(ctl.get()); if (rs < SHUTDOWN || (rs == SHUTDOWN && firstTask == null)) { if (t.isAlive()) // 若线程已经启动了,好比说已经调用了start()方法,那么就抛异常, throw new IllegalThreadStateException(); //添加到workers中 workers.add(w); int s = workers.size(); if (s > largestPoolSize) //更新largestPoolSize largestPoolSize = s; workerAdded = true; } } finally { mainLock.unlock(); } if (workerAdded) { //若Worker建立成功,则启动线程,这么时候worker就会开始执行任务了 t.start(); workerStarted = true; } } } finally { if (! workerStarted) //添加失败 addWorkerFailed(w); } return workerStarted; } private void addWorkerFailed(Worker w) { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { if (w != null) workers.remove(w); decrementWorkerCount(); //每次减小worker或者从队列中移除任务的时候都须要调用这个方法 tryTerminate(); } finally { mainLock.unlock(); } }
这里有个貌似不太起眼的方法tryTerminate,这个方法会在全部可能致使线程池终结的地方调用,好比说减小worker的数目等,若是知足条件的话,那么将线程池转换为TERMINATED状态。另外这个方法没有用private修饰,由于ScheduledThreadPoolExecutor继承自ThreadPoolExecutor,而ScheduledThreadPoolExecutor也会调用这个方法。
final void tryTerminate() { for (;;) { int c = ctl.get(); /* 若是当前线程处于运行中、TIDYING、TERMINATED状态则直接返回,运行中的没 什么好说的,后面两种状态能够说线程池已经正在终结了,另外若是处于SHUTDOWN状态, 而且workQueue非空,代表还有任务须要处理,也直接返回 */ if (isRunning(c) || runStateAtLeast(c, TIDYING) || (runStateOf(c) == SHUTDOWN && ! workQueue.isEmpty())) return; //能够退出,可是线程数非0,那么就中断一个线程,从而使得关闭的信号可以传递下去, //中断worker后,worker捕获异常后,会尝试退出,并在这里继续执行tryTerminate()方法, //从而使得信号传递下去 if (workerCountOf(c) != 0) { interruptIdleWorkers(ONLY_ONE); return; } final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { //尝试转换成TIDYING状态,执行完terminated回调以后 //会转换为TERMINATED状态,这个时候线程池已经完整关闭了, //经过signalAll方法,唤醒全部阻塞在awaitTermination上的线程 if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) { try { terminated(); } finally { ctl.set(ctlOf(TERMINATED, 0)); termination.signalAll(); } return; } } finally { mainLock.unlock(); } // else retry on failed CAS } } /** * 中断空闲的线程 * @param onlyOne */ private void interruptIdleWorkers(boolean onlyOne) { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { for (Worker w : workers) { //遍历全部worker,若以前没有被中断过, //而且获取锁成功,那么就尝试中断。 //锁可以获取成功,那么代表当前worker没有在执行任务,而是在 //获取任务,所以也就达到了只中断空闲线程的目的。 Thread t = w.thread; if (!t.isInterrupted() && w.tryLock()) { try { t.interrupt(); } catch (SecurityException ignore) { } finally { w.unlock(); } } if (onlyOne) break; } } finally { mainLock.unlock(); } }
下面看一下Worker类,也就是这个类实际负责执行任务,Worker类继承自AbstractQueuedSynchronizer,AQS能够理解为一个同步框架,提供了一些通用的机制,利用模板方法模式,让你可以原子的管理同步状态、blocking和unblocking线程、以及队列,具体的内容以后有时间会再写,仍是比较复杂的。这里Worker对AQS的使用相对比较简单,使用了状态变量state表示是否得到锁,0表示解锁、1表示已得到锁,同时经过exclusiveOwnerThread存储当前持有锁的线程。另外再简单提一下,好比说CountDownLatch, 也是基于AQS框架实现的,countdown方法递减state,await阻塞等待state为0。
private final class Worker extends AbstractQueuedSynchronizer implements Runnable { /** Thread this worker is running in. Null if factory fails. */ final Thread thread; /** Initial task to run. Possibly null. */ Runnable firstTask; /** Per-thread task counter */ volatile long completedTasks; Worker(Runnable firstTask) { setState(-1); // inhibit interrupts until runWorker this.firstTask = firstTask; this.thread = getThreadFactory().newThread(this); } /** Delegates main run loop to outer runWorker */ public void run() { runWorker(this); } protected boolean isHeldExclusively() { return getState() != 0; } protected boolean tryAcquire(int unused) { if (compareAndSetState(0, 1)) { setExclusiveOwnerThread(Thread.currentThread()); return true; } return false; } protected boolean tryRelease(int unused) { setExclusiveOwnerThread(null); setState(0); return true; } public void lock() { acquire(1); } public boolean tryLock() { return tryAcquire(1); } public void unlock() { release(1); } public boolean isLocked() { return isHeldExclusively(); } void interruptIfStarted() { Thread t; if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) { try { t.interrupt(); } catch (SecurityException ignore) { } } } }
注意这里Worker初始化的时候,会经过setState(-1)将state设置为-1,并在runWorker()方法中置为0,上文说过Worker是利用state这个变量来表示锁的状态,那么加锁的操做就是经过CAS将state从0改为1,那么初始化的时候改为-1,也就是表示在Worker启动以前,都不容许加锁操做,咱们再看interruptIfStarted()以及interruptIdleWorkers()方法,这两个方法在尝试中断Worker以前,都会先加锁或者判断state是否大于0,所以这里的将state设置为-1,就是为了禁止中断操做,并在runWorker中置为0,也就是说只能在Worker启动以后才可以中断Worker。
另外线程启动以后,其实就是调用了runWorker方法,下面咱们看一下具体是如何实现的。
final void runWorker(Worker w) { Thread wt = Thread.currentThread(); Runnable task = w.firstTask; w.firstTask = null; w.unlock(); // 调用unlock()方法,将state置为0,表示其余操做能够得到锁或者中断worker boolean completedAbruptly = true; try { /* 首先尝试执行firstTask,若没有的话,则调用getTask()从队列中获取任务 */ while (task != null || (task = getTask()) != null) { w.lock(); /* 若是线程池正在关闭,那么中断线程。 */ if ((runStateAtLeast(ctl.get(), STOP) || (Thread.interrupted() && runStateAtLeast(ctl.get(), STOP))) && !wt.isInterrupted()) wt.interrupt(); try { //执行beforeExecute回调 beforeExecute(wt, task); Throwable thrown = null; try { //实际开始执行任务 task.run(); } catch (RuntimeException x) { thrown = x; throw x; } catch (Error x) { thrown = x; throw x; } catch (Throwable x) { thrown = x; throw new Error(x); } finally { //执行afterExecute回调 afterExecute(task, thrown); } } finally { task = null; //这里加了锁,所以没有线程安全的问题,volatile修饰保证其余线程的可见性 w.completedTasks++; w.unlock();//解锁 } } completedAbruptly = false; } finally { //抛异常了,或者当前队列中已没有任务须要处理等 processWorkerExit(w, completedAbruptly); } } private void processWorkerExit(Worker w, boolean completedAbruptly) { //若是是异常终止的,那么减小worker的数目 if (completedAbruptly) // If abrupt, then workerCount wasn't adjusted decrementWorkerCount(); final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { //将当前worker中workers中删除掉,并累加当前worker已执行的任务到completedTaskCount中 completedTaskCount += w.completedTasks; workers.remove(w); } finally { mainLock.unlock(); } //上文说过,减小worker的操做都须要调用这个方法 tryTerminate(); /* 若是当前线程池仍然是运行中的状态,那么就看一下是否须要新增另一个worker替换此worker */ int c = ctl.get(); if (runStateLessThan(c, STOP)) { /* 若是是异常结束的则直接扩容,不然的话则为正常退出,好比当前队列中已经没有任务须要处理, 若是容许core线程超时的话,那么看一下当前队列是否为空,空的话则不用扩容。不然话看一下 是否少于corePoolSize个worker在运行。 */ if (!completedAbruptly) { int min = allowCoreThreadTimeOut ? 0 : corePoolSize; if (min == 0 && ! workQueue.isEmpty()) min = 1; if (workerCountOf(c) >= min) return; // replacement not needed } addWorker(null, false); } } private Runnable getTask() { boolean timedOut = false; // 上一次poll()是否超时了 for (;;) { int c = ctl.get(); int rs = runStateOf(c); // 若线程池关闭了(状态大于STOP) // 或者线程池处于SHUTDOWN状态,可是队列为空,那么返回null if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) { decrementWorkerCount(); return null; } int wc = workerCountOf(c); /* 若是容许core线程超时 或者 不容许core线程超时但当前worker的数目大于core线程数, 那么下面的poll()则超时调用 */ boolean timed = allowCoreThreadTimeOut || wc > corePoolSize; /* 获取任务超时了而且(当前线程池中还有不止一个worker 或者 队列中已经没有任务了),那么就尝试 减小worker的数目,若失败了则重试 */ if ((wc > maximumPoolSize || (timed && timedOut)) && (wc > 1 || workQueue.isEmpty())) { if (compareAndDecrementWorkerCount(c)) return null; continue; } try { //从队列中抓取任务 Runnable r = timed ? workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) : workQueue.take(); if (r != null) return r; //走到这里代表,poll调用超时了 timedOut = true; } catch (InterruptedException retry) { timedOut = false; } } }
关闭线程池通常有两种形式,shutdown()和shutdownNow()。
public void shutdown() { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { checkShutdownAccess(); //经过CAS将状态更改成SHUTDOWN,这个时候线程池不接受新任务,但会继续处理队列中的任务 advanceRunState(SHUTDOWN); //中断全部空闲的worker,也就是说除了正在处理任务的worker,其余阻塞在getTask()上的worker //都会被中断 interruptIdleWorkers(); //执行回调 onShutdown(); // hook for ScheduledThreadPoolExecutor } finally { mainLock.unlock(); } tryTerminate(); //这个方法不会等待全部的任务处理完成才返回 } public List<Runnable> shutdownNow() { List<Runnable> tasks; final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { checkShutdownAccess(); /* 不一样于shutdown(),会转换为STOP状态,再也不处理新任务,队列中的任务也不处理, 并且会中断全部的worker,而不仅是空闲的worker */ advanceRunState(STOP); interruptWorkers(); tasks = drainQueue();//将全部的任务从队列中弹出 } finally { mainLock.unlock(); } tryTerminate(); return tasks; } private List<Runnable> drainQueue() { BlockingQueue<Runnable> q = workQueue; ArrayList<Runnable> taskList = new ArrayList<Runnable>(); /* 将队列中全部的任务remove掉,并添加到taskList中, 可是有些队列比较特殊,好比说DelayQueue,若是第一个任务还没到过时时间,则不会弹出, 所以这里经过调用toArray方法,而后再一个一个的remove掉 */ q.drainTo(taskList); if (!q.isEmpty()) { for (Runnable r : q.toArray(new Runnable[0])) { if (q.remove(r)) taskList.add(r); } } return taskList; }
从上文中能够看到,调用了shutdown()方法后,不会等待全部的任务处理完毕才返回,所以须要调用awaitTermination()来实现。
在此我向你们推荐一个架构学习交流群。交流学习群号:821169538 里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化、分布式架构等这些成为架构师必备的知识体系。还能领取免费的学习资源,目前受益良多。
public boolean awaitTermination(long timeout, TimeUnit unit) throws InterruptedException { long nanos = unit.toNanos(timeout); final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { for (;;) { //线程池若已经终结了,那么就返回 if (runStateAtLeast(ctl.get(), TERMINATED)) return true; //若超时了,也返回掉 if (nanos <= 0) return false; //阻塞在信号量上,等待线程池终结,可是要注意这个方法可能会由于一些未知缘由随时唤醒当前线程, //所以须要重试,在tryTerminate()方法中,执行完terminated()回调后,代表线程池已经终结了, //而后会经过termination.signalAll()唤醒当前线程 nanos = termination.awaitNanos(nanos); } } finally { mainLock.unlock(); } } 一些统计相关的方法 public int getPoolSize() { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { //若线程已终结则直接返回0,不然计算works中的数目 //想一下为何不用workerCount呢? return runStateAtLeast(ctl.get(), TIDYING) ? 0 : workers.size(); } finally { mainLock.unlock(); } } public int getActiveCount() { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { int n = 0; for (Worker w : workers) if (w.isLocked())//上锁的代表worker当前正在处理任务,也就是活跃的worker ++n; return n; } finally { mainLock.unlock(); } } public int getLargestPoolSize() { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { return largestPoolSize; } finally { mainLock.unlock(); } } //获取任务的总数,这个方法慎用,如果个无解队列,或者队列挤压比较严重,会很蛋疼 public long getTaskCount() { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { long n = completedTaskCount;//好比有些worker被销毁后,其处理完成的任务就会叠加到这里 for (Worker w : workers) { n += w.completedTasks;//叠加历史处理完成的任务 if (w.isLocked())//上锁代表正在处理任务,也算一个 ++n; } return n + workQueue.size();//获取队列中的数目 } finally { mainLock.unlock(); } } public long getCompletedTaskCount() { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { long n = completedTaskCount; for (Worker w : workers) n += w.completedTasks; return n; } finally { mainLock.unlock(); } }