
点击上方“武培轩”,选择“设为星标”web
技术文章第一时间送达!数据库
我相信你们都用过线程池,可是线程池数量设置为多少比较合理呢?编程
线程数的设置的最主要的目的是为了充分并合理地使用 CPU 和内存等资源,从而最大限度地提升程序的性能,所以让咱们一块儿去探索吧!微信
首先要考虑到 CPU 核心数,那么在 Java 中如何获取核心线程数?网络
可使用 Runtime.getRuntime().availableProcessor()
方法来获取(可能不许确,做为参考)多线程
在确认了核心数后,再去判断是 CPU 密集型任务仍是 IO 密集型任务:并发
-
CPU 密集型任务:好比像加解密,压缩、计算等一系列须要大量耗费 CPU 资源的任务, 大部分场景下都是纯 CPU 计算。 -
IO 密集型任务:好比像 MySQL 数据库、文件的读写、网络通讯等任务,这类任务 不会特别消耗 CPU 资源,可是 IO 操做比较耗时,会占用比较多时间。
在知道如何判断任务的类别后,让咱们分两个场景进行讨论:app
CPU 密集型任务
对于 CPU 密集型计算,多线程本质上是提高多核 CPU 的利用率,因此对于一个 8 核的 CPU,每一个核一个线程,理论上建立 8 个线程就能够了。编辑器
若是设置过多的线程数,实际上并不会起到很好的效果。此时假设咱们设置的线程数量是 CPU 核心数的 2 倍,由于计算任务很是重,会占用大量的 CPU 资源,因此这时 CPU 的每一个核心工做基本都是满负荷的,而咱们又设置了过多的线程,每一个线程都想去利用 CPU 资源来执行本身的任务,这就会形成没必要要的上下文切换,此时线程数的增多并无让性能提高,反而因为线程数量过多会致使性能降低。工具
所以,对于 CPU 密集型的计算场景,理论上线程的数量 = CPU 核数就是最合适的,不过一般把线程的数量设置为CPU 核数 +1,会实现最优的利用率。即便当密集型的线程因为偶尔的内存页失效或其余缘由致使阻塞时,这个额外的线程也能确保 CPU 的时钟周期不会被浪费,从而保证 CPU 的利用率。
以下图就是在一个 8 核 CPU 的电脑上,经过修改线程数来测试对 CPU 密集型任务(素数计算)的性能影响。

能够看到线程数小于 8 时,性能是不好的,在线程数多于处理器核心数对性能的提高也很小,所以能够验证公式仍是具备必定适用性的。
除此以外,咱们最好还要同时考虑在同一台机器上还有哪些其余会占用过多 CPU 资源的程序在运行,而后对资源使用作总体的平衡。
IO 密集型任务
对于 IO 密集型任务最大线程数通常会大于 CPU 核心数不少倍,由于 IO 读写速度相比于 CPU 的速度而言是比较慢的,若是咱们设置过少的线程数,就可能致使 CPU 资源的浪费。而若是咱们设置更多的线程数,那么当一部分线程正在等待 IO 的时候,它们此时并不须要 CPU 来计算,那么另外的线程即可以利用 CPU 去执行其余的任务,互不影响,这样的话在任务队列中等待的任务就会减小,能够更好地利用资源。
对于 IO 密集型计算场景,最佳的线程数是与程序中 CPU 计算和 IO 操做的耗时比相关的,《Java并发编程实战》的做者 Brain Goetz 推荐的计算方法以下:
线程数 = CPU 核心数 * (1 + IO 耗时/ CPU 耗时)
经过这个公式,咱们能够计算出一个合理的线程数量,若是任务的平均等待时间长,线程数就随之增长,而若是平均工做时间长,也就是对于咱们上面的 CPU 密集型任务,线程数就随之减小。能够采用 APM 工具统计到每一个方法的耗时,便于计算 IO 耗时和 CPU 耗时。
在这里引用Java并发编程实战中的图,方便你们更容易理解:

还有一派的计算方式是《Java虚拟机并发编程》中提出的:
线程数 = CPU 核心数 / (1 - 阻塞系数)
其中计算密集型阻塞系数为 0,IO 密集型阻塞系数接近 1,通常认为在 0.8 ~ 0.9 之间。好比 双 核 CPU,按照公式就是 2 / ( 1 - 0.9 ) = 20 个线程数

上图是 IO 密集型任务的一个测试,是在双核处理器上开不一样的线程数(从 1 到 40)来测试对程序性能的影响,能够看到线程池数量达到 20 以后,曲线逐渐水平,说明开再多的线程对程序的性能提高也毫无帮助。
太少的线程数会使得程序总体性能下降,而过多的线程也会消耗内存等其余资源,因此若是想要更准确的话,能够进行压测,监控 JVM 的线程状况以及 CPU 的负载状况,根据实际状况衡量应该建立的线程数,合理并充分利用资源。
同时,有不少线程池的应用,好比 Tomcat、Redis、Jdbc 等,每一个应用设置的线程数也是不一样的,好比 Tomcat 为流量入口,那么线程数的设置可能就要比其余应用要大。
总结
经过对线程数设置的探究,咱们能够得知线程数的设置首先和 CPU 核心数有莫大关联,除此以外,咱们须要根据任务类型的不一样选择对应的策略,线程的平均工做时间所占比例越高,就须要越少的线程;线程的平均等待时间所占比例越高,就须要越多的线程;针对不一样的程序,进行对应的实际测试就能够获得最合适的选择。
参考
《Java并发编程实战》
《Java虚拟机并发编程》
Java并发编程实战
Java并发编程核心
完

本文分享自微信公众号 - 武培轩(wupeixuan404)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。