这周刚上班忽然有一个项目内存溢出了,排查了半天终于找到问题所在,在此记录下,防止后面再次出现相似的状况。html
先简单说下当出现内存溢出以后,我是如何排查的,首先经过jstack打印出堆栈信息,而后经过分析工具对这些文件进行分析,根据分析结果咱们就能够知道大概是因为什么问题引发的。java
关于jstack如何使用,你们能够先看看这篇文章 jstack的使用程序员
下面是我打印出来的信息,大部分都是这个apache
"http-nio-8761-exec-124" #580 daemon prio=5 os_prio=0 tid=0x00007fbd980c0800 nid=0x249 waiting on condition [0x00007fbcf09c8000] java.lang.Thread.State: TIMED_WAITING (parking) at sun.misc.Unsafe.park(Native Method) - parking to wait for <0x00000000f73a4508> (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject) at java.util.concurrent.locks.LockSupport.parkNanos(LockSupport.java:215) at java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.awaitNanos(AbstractQueuedSynchronizer.java:2078) at java.util.concurrent.LinkedBlockingQueue.poll(LinkedBlockingQueue.java:467) at org.apache.tomcat.util.threads.TaskQueue.poll(TaskQueue.java:85) at org.apache.tomcat.util.threads.TaskQueue.poll(TaskQueue.java:31) at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:1073) at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1134) at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) at org.apache.tomcat.util.threads.TaskThread$WrappingRunnable.run(TaskThread.java:61) at java.lang.Thread.run(Thread.java:748)
看到了如上信息以后,大概能够看出是因为线程池的使用不当致使的,那么根据信息继续往下看,看到ThreadPoolExecutor那么就能够知道这确定是建立了线程池,那么咱们就在代码里找,哪里建立使用了线程池,我就找到这么一段代码。数组
public class ThreadPool { private static ExecutorService pool; private static long logTime = 0; public static ExecutorService getPool() { if (pool == null) { pool = Executors.newFixedThreadPool(20); } return pool; } }
乍一看,可能写的同窗是想把这当一个全局的线程池用,全部的业务凡是用到线程的都会使用这个类,为了统一管理线程,想法没什么毛病,可是这样写确实有点子毛病。tomcat
上面使用了Executors.newFixedThreadPool(20)建立了一个固定的线程池,咱们先分析下newFixedThreadPool是怎么样的一个流程。微信
一个请求进来以后,若是核心线程有空闲线程直接使用核心线程中的线程执行任务,不会添加到阻塞队列中,若是核心线程满了,新的任务会添加到阻塞队列,直到队列加满再开线程,直到maxPoolSize以后再触发拒绝执行策略app
了解了流程以后咱们再来看newFixedThreadPool的代码实现。工具
public static ExecutorService newFixedThreadPool(int nThreads) { return new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>()); }
public LinkedBlockingQueue() { this(Integer.MAX_VALUE); }
public LinkedBlockingQueue(int capacity) { if (capacity <= 0) throw new IllegalArgumentException(); // 任务阻塞队列的初始容量 this.capacity = capacity; last = head = new Node<E>(null); }
看到了这里不知道你是否知道了这次引发内存泄漏的缘由,其实就是由于阻塞队列的容量过大。测试
若是不手动的指定阻塞队列的大小,那么它默认是Integer.MAX_VALUE,咱们的线程池只有20个线程能够处理任务,其余的请求所有放到阻塞队列中,那么当涌入大量的请求以后,阻塞队列一直增长,你的内存配置又很是紧凑的话,那么是很容易出现内存溢出的。
咱们的业务是在APP启动的时候,会使用线程池去检查用户的一些配置,应用的启动量仍是很是大的并且给的内存配置也不是很足,因此运行一段时间后,部分容器就出现了内存溢出的状况。
之前其实没太在乎这种问题,都是使用Executors去建立线程,可是这样确实会存在一些问题,就像这些的内存泄漏,因此通常不要使用Executors去建立线程,使用ThreadPoolExecutor进行建立,其实Executors底层也是使用ThreadPoolExecutor进行建立的。
使用ThreadPoolExecutor建立须要本身指定核心线程数、最大线程数、线程的空闲时长以及阻塞队列。
咱们使用了有界的队列,那么当队列满了以后如何处理后面进入的请求,咱们能够经过不一样的策略进行设置。
在建立以前,先说下我最开始的版本,由于队列是固定的,最开始咱们不知道有拒绝策略,因此在队列满了以后再添加的话会出现异常,我就在异常里面睡眠了1秒,等待其余的线程执行完毕获取空闲链接,可是仍是会有部分不能获得执行。
接下来咱们来建立一个容错率比较高的线程池。
public class WordTest { public static void main(String[] args) throws InterruptedException { System.out.println("开始执行"); // 阻塞队列容量声明为100个 ThreadPoolExecutor executorService = new ThreadPoolExecutor(10, 10, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<>(100)); // 设置拒绝策略 executorService.setRejectedExecutionHandler(new ThreadPoolExecutor.CallerRunsPolicy()); // 空闲队列存活时间 executorService.setKeepAliveTime(20, TimeUnit.SECONDS); List<Integer> list = new ArrayList<>(2000); try { // 模拟200个请求 for (int i = 0; i < 200; i++) { final int num = i; executorService.execute(() -> { System.out.println(Thread.currentThread().getName() + "-结果:" + num); list.add(num); }); } } finally { executorService.shutdown(); executorService.awaitTermination(10, TimeUnit.SECONDS); } System.out.println("线程执行结束"); } }
思路:我声明了100容量的阻塞队列,模拟了一个200的请求,很显然确定有部分请求进入不了队列,可是我使用了CallerRunsPolicy策略,当队列满了以后,使用主线程去进行处理,这样就不会出现有部分请求得不到执行的状况,也不会由于由于阻塞队列过大致使内存溢出的状况。
若是还有什么更好地写法欢迎各位指教!
经过测试200个请求所有获得执行,有3个请求由主线程进行了处理。
如何更好的建立线程池上面已经说过了,关于线程池在业务中的使用,其实咱们这种全局的思路是不太好的,由于若是从全局考虑去建立线程池,是很难把控的,由于你没法准确地评估全部的请求加起来会有多大的量,因此最好是每一个业务建立独立的线程池进行处理,这样是很容易评估量化的。
另外建立的时候,最好评估下大概每秒的请求量有多少,而后来合理的初始化线程数和队列大小。
参考文章:<br/>
https://www.cnblogs.com/muxi0...
更多精彩内容请关注微信公众号:一个程序员的成长