阿里大佬带你,深刻理解线程池底层原理

为何要使用线程池

在实际使用中,线程是很占用系统资源的,若是对线程管理不善很容易致使系统问题。 所以,在大多数并发框架中都会使用线程池来管理线程,使用线程池管理线程主要有以下好处:数据库

(1)下降资源消耗。经过复用已存在的线程和下降线程关闭的次数来尽量下降系统性能损耗bash

(2)提高系统响应速度。经过复用线程,省去建立线程的过程,所以总体上提高了系统的响应速度数据结构

(3)提升线程的可管理性。线程是稀缺资源,若是无限制的建立,不只会消耗系统资源, 还会下降系统的稳定性,所以,须要使用线程池来管理线程。并发

线程池的工做原理

当一个并发任务提交给线程池,线程池分配线程去执行任务的过程以下:框架



线程池执行所提交的任务过程主要有这样几个阶段:异步

(1)先判断线程池中核心线程池全部的线程是否都在执行任务。 若是不是,则新建立一个线程执行刚提交的任务,不然,核心线程池中全部的线程都在执行任务,则进入(2)性能

(2)判断当前阻塞队列是否已满,若是未满, 则将提交的任务放置在阻塞队列中;不然,则进入(3)ui

(3)判断线程池中全部的线程是否都在执行任务, 若是没有,则建立一个新的线程来执行任务,不然,则交给饱和策略进行处理spa

线程池执行逻辑

经过ThreadPoolExecutor建立线程池后,提交任务后执行过程是怎样的,下面来经过源码来看一看。execute()方法源码以下:线程

public void execute(Runnable command) {
    if (command == null)
        throw new NullPointerException();
    int c = ctl.get();
	//若是线程池的线程个数少于corePoolSize则建立新线程执行当前任务
    if (workerCountOf(c) < corePoolSize) {
        if (addWorker(command, true))
            return;
        c = ctl.get();
    }
	//若是线程个数大于corePoolSize或者建立线程失败,则将任务存放在阻塞队列workQueue中
    if (isRunning(c) && workQueue.offer(command)) {
        int recheck = ctl.get();
        if (! isRunning(recheck) && remove(command))
            reject(command);
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
	//若是当前任务没法放进阻塞队列中,则建立新的线程来执行任务
    else if (!addWorker(command, false))
        reject(command);
}复制代码

execute()执行过程:

execute方法执行逻辑有这样几种状况:

(1)若是当前运行的线程少于corePoolSize,则会建立新的线程来执行新的任务,即便线程池中的其余线程是空闲的;

(2)若是运行的线程个数等于或者大于corePoolSize且小于maximumPoolSize,则会将提交的任务存放到阻塞队列workQueue中;

(3)若是当前workQueue队列已满的话,则会建立新的线程来执行任务;

(4)若是线程个数已经超过了maximumPoolSize,则会使用饱和策略RejectedExecutionHandler来进行处理增量的任务。



线程池的关闭

关闭线程池,能够经过shutdown和shutdownNow这两个方法。 它们的原理都是遍历线程池中全部的线程,而后依次中断线程。 shutdown和shutdownNow仍是有不同的地方:

  • shutdownNow首先将线程池的状态设置为STOP,而后尝试中止全部的正在执行和未执行任务的线程,并返回等待执行任务的列表
  • shutdown只是将线程池的状态设置为SHUTDOWN状态,而后中断全部没有正在执行任务的线程

能够看出shutdown方法会将正在执行的任务继续执行完,而shutdownNow会直接中断正在执行的任务。 调用了这两个方法的任意一个,isShutdown方法都会返回true, 当全部的线程都关闭成功,才表示线程池成功关闭,这时调用isTerminated方法才会返回true。

如何合理配置线程池参数

要想合理的配置线程池,就必须首先分析任务特性,能够从如下几个角度来进行分析:

  • 任务的性质:CPU密集型任务,IO密集型任务和混合型任务。
  • 任务的优先级:高,中和低。
  • 任务的执行时间:长,中和短。
  • 任务的依赖性:是否依赖其余系统资源,如数据库链接。
  1. CPU密集型任务配置尽量少的线程数量,如配置(N cpu)+1个线程的线程池。
  2. IO密集型任务则因为须要等待IO操做,线程并非一直在执行任务,则配置尽量多的线程,如2 * (N cpu)。
  3. 混合型的任务,若是能够拆分,则将其拆分红一个CPU密集型任务和一个IO密集型任务,只要这两个任务执行的时间相差不是太大,那么分解后执行的吞吐率要高于串行执行的吞吐率,若是这两个任务执行时间相差太大,则不必进行分解。
  4. 咱们能够经过Runtime.getRuntime().availableProcessors()方法得到当前设备的CPU个数。

优先级不一样的任务可使用优先级队列PriorityBlockingQueue来处理。它可让优先级高的任务先获得执行,须要注意的是若是一直有优先级高的任务提交到队列里,那么优先级低的任务可能永远不能执行。

执行时间不一样的任务能够交给不一样规模的线程池来处理,或者也可使用优先级队列,让执行时间短的任务先执行。

依赖数据库链接池的任务,由于线程提交SQL后须要等待数据库返回结果,若是等待的时间越长CPU空闲时间就越长,那么线程数应该设置越大,这样才能更好的利用CPU。

阻塞队列最好是使用有界队列,若是采用无界队列的话,一旦任务积压在阻塞队列中的话就会占用过多的内存资源,甚至会使得系统崩溃。

ScheduledThreadPoolExecutor

ScheduledThreadPoolExecutor继承了ThreadPoolExecutor类, 所以,总体上功能一致,线程池主要负责建立线程(Worker类), 线程从阻塞队列中不断获取新的异步任务,直到阻塞队列中已经没有了异步任务为止。 可是相较于ThreadPoolExecutor来讲,ScheduledThreadPoolExecutor 具备延时执行任务周期性执行任务的特性, ScheduledThreadPoolExecutor从新设计了任务类ScheduleFutureTask, ScheduleFutureTask重写了run方法使其具备可延时执行和可周期性执行任务的特性。 另外,阻塞队列DelayedWorkQueue是可根据优先级排序的队列,采用了堆的底层数据结构, 使得与当前时间相比,将待执行时间越靠近的任务放置到队头,以便线程可以获取到任务进行执行

线程池不管是ThreadPoolExecutor仍是ScheduledThreadPoolExecutor, 在设计时的三个关键要素是:任务执行者以及任务结果。 它们的设计思想也是彻底将这三个关键要素进行了解耦。

执行者

任务的执行机制,彻底交由Worker类,也就是进一步了封装了Thread。 向线程池提交任务,不管为ThreadPoolExecutor的execute方法和submit方法, 仍是ScheduledThreadPoolExecutor的schedule方法,都是先将任务移入到阻塞队列中, 而后经过addWork方法新建了Work类,并经过runWorker方法启动线程,并 不断的从阻塞对列中获取异步任务执行交给Worker执行,直至阻塞队列中没法取到任务为止。

任务

在ThreadPoolExecutor和ScheduledThreadPoolExecutor中任务是指实现了Runnable接口和Callable接口的实现类。 ThreadPoolExecutor中会将任务转换成FutureTask类, 而在ScheduledThreadPoolExecutor中为了实现可延时执行任务和周期性执行任务的特性, 任务会被转换成ScheduledFutureTask类,该类继承了FutureTask,并重写了run方法。

任务结果

在ThreadPoolExecutor中提交任务后,获取任务结果能够经过Future接口的类, 在ThreadPoolExecutor中实际上为FutureTask类, 而在ScheduledThreadPoolExecutor中则是ScheduledFutureTask类

线程池的状态

线程池的状态有:

  • RUNNING:能接受新提交的任务,而且也可以处理阻塞队列中的任务;
  • SHUTDOWN:再也不接受新提交的任务,可是能够处理存量任务(即阻塞队列中的任务);
  • STOP:再也不接受新提交的任务,也不处理存量任务;
  • TIDYING:全部任务都已终止;
  • TERMINATED:默认是什么也不作的,只是做为一个标识。

状态转移以下图所示:



工做线程的生命周期:


相关文章
相关标签/搜索