老板:再用Log4j就收拾东西回家吧!

以前一段时间,为咱们发现的一个SaaS应用程序会间歇性地卡顿、变慢,由于很长时间都没有定位到缘由,因此解决的办法就只能是重启。数据库

这个现象和以前咱们遇到的程序变得卡顿不太同样,由于咱们发现这个应用程序不只在高流量期间时会变慢,有时在低流量时期也会变慢。因此这令你们都很奇怪。apache

这类应用程序的变慢,从新启动以后就能够维持一段时间,可是过段时间又有可能会再次出现。编程


故障排除
当咱们准备排查这个问题的时候,咱们在应用程序速度很慢的时候,尝试着捕获了这个应用程序的线程Dump。有不少种方式来捕获线程转Dump,咱们选择了“jstack”工具来获取。
在问题发生时得到线程Dump是很是关键的!
而后咱们将捕获的线程Dump上传到一个线上线程Dump分析工具(https://fastthread.io/)。该工具当即帮咱们生成了一份报告。
报告当即找出了问题的根本缘由。分析工具上显示“http-nio-8080-exec-121”线程阻塞了100多个线程。下面是传递依赖图,展现了阻塞线程:
从图中能够看到100多个线程被“http-nio-8080-exec-121”线程阻塞。当咱们点击图中的“http-nio-8080-exec-121”超连接时,它会打印出线程的堆栈轨迹:
仔细观察图中被框出来的部分,你能够看到该线程已经获取到 org.apache.log4j.Logger 的锁,正在进行其余的操做。
接下来,咱们随便找一个被"http-nio-8080-exec-121"阻塞的线程,看一下他的堆栈信息:
看一下上面堆栈跟踪中被框出来的部分。咱们能够看到“http-nio-8080-exec-56”当前正处于阻塞(BLOCKED)状态,而阻塞的缘由是它正在等待获取 org.apache.log4j.Logger 的锁。
前面咱们刚刚分析过,“http-nio-8080-exec-121”得到了org.apache.log4j.Logger的锁,正在进行其余操做,而锁并无被释放,因此其余线程想要得到锁就只能被阻塞。
其他的全部被阻塞的线程也在等待获取 org.apache.log4j.Logger 的锁。所以,每当任何应用程序线程试图记录日志时,它都会由于没法获取到锁而进入阻塞状态。
刚开始咱们也没有太多的头绪,后来咱们尝试借助Google的力量,而后咱们用谷歌搜索了"org.apache.log4j.Logger 阻塞 线程"这样的关键字。
咱们在Apache Log4j bug数据库中偶然发现了这个有趣的Bug,并且这个Bug早在2015年就被发现了。(https://bz.apache.org/bugzilla/show_bug.cgi?id=57714 )。
这是Log4J框架中已知的bug之一,也是开发新的Log4j2框架的主要缘由之一。
因为这个bug,任何试图打印日志的线程都进入了阻塞状态。它致使整个应用程序嘎然而止。一旦应用程序从Log4j迁移到Log4j2框架,问题就解决了。

结论
Log4j已经在2015年8月开始就再也不被维护了。若是您的应用程序仍在使用Log4J框架,强烈建议升级到Log4j2框架。Log4j2不只仅是Log4j框架的下一个版本,它是一个从零开始编写的新框架,它有不少性能改进。
最后,若是网站遇到程序被拖慢的问题,那么也能够考虑一下这个因素。
关于做者漫话编程,是一个经过漫画+音频的形式讲解枯燥的编程知识的公众号。致力于让编程变得更有乐趣。



        

往期推荐c#

京东热 key 探测框架新版发布,单机 QPS 可达 35 万微信


Docker真的被禁止使用了?并发


《Java开发手册》解读:大整数传输为什么禁用Long类型?app


本文由“壹伴编辑器”提供技术支
 

直面Java第329期:哪一个命令能够监控虚拟机各类运行状态信息?框架

深刻并发第013期:拓展synchronized——锁优化编辑器


若是你喜欢本文,
工具

请长按二维码,关注 Hollis.

转发至朋友圈,是对我最大的支持。


点个 在看 
喜欢是一种感受
在看是一种支持
↘↘↘

本文分享自微信公众号 - Hollis(hollischuang)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索