神秘的偶发服务超时,原因可能是那些坏邻居

恶邻A君 唯品会在服务化体系改造的初期,一个对延时敏感的应用,偶然会发生一些超时,事发当时zabbix分钟级监控,dstat秒级监控的服务器指标都正常,应用,数据库,缓存,网络也正常,那这是为什么呢? 某天脑洞大开,把怀疑的目光投向了在后台运行日志收集程序Flume,发现它的GC运行得比较狂野,于是对它的GC线程数做了限制: 修改前:15分钟内, 大于30ms的业务调用173次, 大于50ms的2
相关文章
相关标签/搜索