如何优雅的使用和理解线程池

前言

平时接触过多线程开发的童鞋应该都或多或少了解过线程池,以前发布的《阿里巴巴 Java 手册》里也有一条:java

可见线程池的重要性。git

简单来讲使用线程池有如下几个目的:github

  • 线程是稀缺资源,不能频繁的建立。
  • 解耦做用;线程的建立于执行彻底分开,方便维护。
  • 应当将其放入一个池子中,能够给其余任务进行复用。

线程池原理

谈到线程池就会想到池化技术,其中最核心的思想就是把宝贵的资源放到一个池子中;每次使用都从里面获取,用完以后又放回池子供其余人使用,有点吃大锅饭的意思。api

那在 Java 中又是如何实现的呢?多线程

在 JDK 1.5 以后推出了相关的 api,常见的建立线程池方式有如下几种:并发

  • Executors.newCachedThreadPool():无限线程池。
  • Executors.newFixedThreadPool(nThreads):建立固定大小的线程池。
  • Executors.newSingleThreadExecutor():建立单个线程的线程池。

其实看这三种方式建立的源码就会发现:异步

public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue<Runnable>());
    }
复制代码

实际上仍是利用 ThreadPoolExecutor 类实现的。ide

因此咱们重点来看下 ThreadPoolExecutor 是怎么玩的。函数

首先是建立线程的 api:测试

ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, RejectedExecutionHandler handler) 
复制代码

这几个核心参数的做用:

  • corePoolSize 为线程池的基本大小。
  • maximumPoolSize 为线程池最大线程大小。
  • keepAliveTimeunit 则是线程空闲后的存活时间。
  • workQueue 用于存听任务的阻塞队列。
  • handler 当队列和最大线程池都满了以后的饱和策略。

了解了这几个参数再来看看实际的运用。

一般咱们都是使用:

threadPool.execute(new Job());
复制代码

这样的方式来提交一个任务到线程池中,因此核心的逻辑就是 execute() 函数了。

在具体分析以前先了解下线程池中所定义的状态,这些状态都和线程的执行密切相关:

  • RUNNING 天然是运行状态,指能够接受任务执行队列里的任务
  • SHUTDOWN 指调用了 shutdown() 方法,再也不接受新任务了,可是队列里的任务得执行完毕。
  • STOP 指调用了 shutdownNow() 方法,再也不接受新任务,同时抛弃阻塞队列里的全部任务并中断全部正在执行任务。
  • TIDYING 全部任务都执行完毕,在调用 shutdown()/shutdownNow() 中都会尝试更新为这个状态。
  • TERMINATED 终止状态,当执行 terminated() 后会更新为这个状态。

用图表示为:

而后看看 execute() 方法是如何处理的:

  1. 获取当前线程池的状态。
  2. 当前线程数量小于 coreSize 时建立一个新的线程运行。
  3. 若是当前线程处于运行状态,而且写入阻塞队列成功。
  4. 双重检查,再次获取线程状态;若是线程状态变了(非运行状态)就须要从阻塞队列移除任务,并尝试判断线程是否所有执行完毕。同时执行拒绝策略。
  5. 若是当前线程池为空就新建立一个线程并执行。
  6. 若是在第三步的判断为非运行状态,尝试新建线程,若是失败则执行拒绝策略。

这里借助《聊聊并发》的一张图来描述这个流程:

如何配置线程

流程聊完了再来看看上文提到了几个核心参数应该如何配置呢?

有一点是确定的,线程池确定是否是越大越好。

一般咱们是须要根据这批任务执行的性质来肯定的。

  • IO 密集型任务:因为线程并非一直在运行,因此能够尽量的多配置线程,好比 CPU 个数 * 2
  • CPU 密集型任务(大量复杂的运算)应当分配较少的线程,好比 CPU 个数至关的大小。

固然这些都是经验值,最好的方式仍是根据实际状况测试得出最佳配置。

优雅的关闭线程池

有运行任务天然也有关闭任务,从上文提到的 5 个状态就能看出如何来关闭线程池。

其实无非就是两个方法 shutdown()/shutdownNow()

但他们有着重要的区别:

  • shutdown() 执行后中止接受新任务,会把队列的任务执行完毕。
  • shutdownNow() 也是中止接受新任务,但会中断全部的任务,将线程池状态变为 stop。

两个方法都会中断线程,用户可自行判断是否须要响应中断。

shutdownNow() 要更简单粗暴,能够根据实际场景选择不一样的方法。

我一般是按照如下方式关闭线程池的:

long start = System.currentTimeMillis();
        for (int i = 0; i <= 5; i++) {
            pool.execute(new Job());
        }

        pool.shutdown();

        while (!pool.awaitTermination(1, TimeUnit.SECONDS)) {
            LOGGER.info("线程还在执行。。。");
        }
        long end = System.currentTimeMillis();
        LOGGER.info("一共处理了【{}】", (end - start));
复制代码

pool.awaitTermination(1, TimeUnit.SECONDS) 会每隔一秒钟检查一次是否执行完毕(状态为 TERMINATED),当从 while 循环退出时就代表线程池已经彻底终止了。

SpringBoot 使用线程池

2018 年了,SpringBoot 盛行;来看看在 SpringBoot 中应当怎么配置和使用线程池。

既然用了 SpringBoot ,那天然得发挥 Spring 的特性,因此须要 Spring 来帮咱们管理线程池:

@Configuration
public class TreadPoolConfig {


    /** * 消费队列线程 * @return */
    @Bean(value = "consumerQueueThreadPool")
    public ExecutorService buildConsumerQueueThreadPool(){
        ThreadFactory namedThreadFactory = new ThreadFactoryBuilder()
                .setNameFormat("consumer-queue-thread-%d").build();

        ExecutorService pool = new ThreadPoolExecutor(5, 5, 0L, TimeUnit.MILLISECONDS,
                new ArrayBlockingQueue<Runnable>(5),namedThreadFactory,new ThreadPoolExecutor.AbortPolicy());

        return pool ;
    }



}
复制代码

使用时:

@Resource(name = "consumerQueueThreadPool")
    private ExecutorService consumerQueueThreadPool;


    @Override
    public void execute() {

        //消费队列
        for (int i = 0; i < 5; i++) {
            consumerQueueThreadPool.execute(new ConsumerQueueThread());
        }

    }
复制代码

其实也挺简单,就是建立了一个线程池的 bean,在使用时直接从 Spring 中取出便可。

监控线程池

谈到了 SpringBoot,也可利用它 actuator 组件来作线程池的监控。

线程怎么说都是稀缺资源,对线程池的监控能够知道本身任务执行的情况、效率等。

关于 actuator 就再也不细说了,感兴趣的能够看看这篇,有详细整理过如何暴露监控端点。

其实 ThreadPool 自己已经提供了很多 api 能够获取线程状态:

不少方法看名字就知道其含义,只须要将这些信息暴露到 SpringBoot 的监控端点中,咱们就能够在可视化页面查看当前的线程池状态了。

甚至咱们能够继承线程池扩展其中的几个函数来自定义监控逻辑:

看这些名称和定义都知道,这是让子类来实现的。

能够在线程执行前、后、终止状态执行自定义逻辑。

线程池隔离

线程池看似很美好,但也会带来一些问题。

若是咱们不少业务都依赖于同一个线程池,当其中一个业务由于各类不可控的缘由消耗了全部的线程,致使线程池所有占满。

这样其余的业务也就不能正常运转了,这对系统的打击是巨大的。

好比咱们 Tomcat 接受请求的线程池,假设其中一些响应特别慢,线程资源得不到回收释放;线程池慢慢被占满,最坏的状况就是整个应用都不能提供服务。

因此咱们须要将线程池进行隔离

一般的作法是按照业务进行划分:

好比下单的任务用一个线程池,获取数据的任务用另外一个线程池。这样即便其中一个出现问题把线程池耗尽,那也不会影响其余的任务运行。

hystrix 隔离

这样的需求 Hystrix 已经帮咱们实现了。

Hystrix 是一款开源的容错插件,具备依赖隔离、系统容错降级等功能。

下面来看看 Hystrix 简单的应用:

首先须要定义两个线程池,分别用于执行订单、处理用户。

/** * Function:订单服务 * * @author crossoverJie * Date: 2018/7/28 16:43 * @since JDK 1.8 */
public class CommandOrder extends HystrixCommand<String> {

    private final static Logger LOGGER = LoggerFactory.getLogger(CommandOrder.class);

    private String orderName;

    public CommandOrder(String orderName) {


        super(Setter.withGroupKey(
                //服务分组
                HystrixCommandGroupKey.Factory.asKey("OrderGroup"))
                //线程分组
                .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("OrderPool"))

                //线程池配置
                .andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter()
                        .withCoreSize(10)
                        .withKeepAliveTimeMinutes(5)
                        .withMaxQueueSize(10)
                        .withQueueSizeRejectionThreshold(10000))

                .andCommandPropertiesDefaults(
                        HystrixCommandProperties.Setter()
                                .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.THREAD))
        )
        ;
        this.orderName = orderName;
    }


    @Override
    public String run() throws Exception {

        LOGGER.info("orderName=[{}]", orderName);

        TimeUnit.MILLISECONDS.sleep(100);
        return "OrderName=" + orderName;
    }


}


/** * Function:用户服务 * * @author crossoverJie * Date: 2018/7/28 16:43 * @since JDK 1.8 */
public class CommandUser extends HystrixCommand<String> {

    private final static Logger LOGGER = LoggerFactory.getLogger(CommandUser.class);

    private String userName;

    public CommandUser(String userName) {


        super(Setter.withGroupKey(
                //服务分组
                HystrixCommandGroupKey.Factory.asKey("UserGroup"))
                //线程分组
                .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("UserPool"))

                //线程池配置
                .andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter()
                        .withCoreSize(10)
                        .withKeepAliveTimeMinutes(5)
                        .withMaxQueueSize(10)
                        .withQueueSizeRejectionThreshold(10000))

                //线程池隔离
                .andCommandPropertiesDefaults(
                        HystrixCommandProperties.Setter()
                                .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.THREAD))
        )
        ;
        this.userName = userName;
    }


    @Override
    public String run() throws Exception {

        LOGGER.info("userName=[{}]", userName);

        TimeUnit.MILLISECONDS.sleep(100);
        return "userName=" + userName;
    }


}
复制代码

api 特别简洁易懂,具体详情请查看官方文档。

而后模拟运行:

public static void main(String[] args) throws Exception {
        CommandOrder commandPhone = new CommandOrder("手机");
        CommandOrder command = new CommandOrder("电视");


        //阻塞方式执行
        String execute = commandPhone.execute();
        LOGGER.info("execute=[{}]", execute);

        //异步非阻塞方式
        Future<String> queue = command.queue();
        String value = queue.get(200, TimeUnit.MILLISECONDS);
        LOGGER.info("value=[{}]", value);


        CommandUser commandUser = new CommandUser("张三");
        String name = commandUser.execute();
        LOGGER.info("name=[{}]", name);
    }
复制代码

运行结果:

能够看到两个任务分红了两个线程池运行,他们之间互不干扰。

获取任务任务结果支持同步阻塞和异步非阻塞方式,可自行选择。

它的实现原理其实容易猜到:

利用一个 Map 来存放不一样业务对应的线程池。

经过刚才的构造函数也能证实:

还要注意的一点是:

自定义的 Command 并非一个单例,每次执行须要 new 一个实例,否则会报 This instance can only be executed once. Please instantiate a new instance. 异常。

总结

池化技术确实在平时应用普遍,熟练掌握能提升很多效率。

文末的 hystrix 源码:

github.com/crossoverJi…

最后插播个小广告:

Java-Interview 截止目前将近 8K star。

此次定个小目标:争取冲击 1W star

感谢各位老铁的支持与点赞。

欢迎关注公众号一块儿交流:

相关文章
相关标签/搜索