一个cp命令引起的mongodb大量慢查询

遇到问题:凌晨收到报警,某mongodb服务器cpu load超过8。因为没有影响到业务,次日一早开始查缘由。
mongodb


查缘由:服务器

1. 先了解该服务器上的应用有哪些ide

    该db服务器主要应用只有mongodb。因而开始查询mongodb日志:性能

经过凌晨的日志mongodb.log查看,有大量的慢查询,但实际上这些表都很是小,只有几百行数据,并且表还有索引,却仅仅一个查询花了60~80s,慢查询以后的日志显示该节点不被其余节点检测到(mongodb复制集形式)。spa

wKiom1gZXljjDea6AAmHVICatn8483.png-wh_50

因为一个小表的查询都须要判断70s左右,并且mongodb部署的是复制集形式(其余的查询节点都是正常的)能够判断,多是这台db的性能方面影响了mongodb,而非mongodb自己的性能影响。3d


2. 因而查看凌晨有什么任务再跑。日志

crontab -l 发现确实凌晨有一个任务。是一个切割日志的脚本。大概就是把日志cp到另外一个目录,而后将当前日志清空,继续记录新的一天的日志。blog


但这个日志平时都较小,也运行了很长时间.只能试一试的看看日志目录索引


wKioL1gZWOKxEuHYAAATiMt--TM154.png-wh_50


看到日志忽然就这么大了。难道是由于晚上cp 文件的时候致使了?crontab

差很少判断问题出如今 cp致使了io负载太高,进而致使了cpu load 太高。


3. 复现问题

因为该操做在夜间操做,未影响线上业务。故手动操做cp,复现问题。

cp 了一个近3g的文件, 以下图:看到产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。

跟着cpu load也 上升到10 (每一分钟的cpu load 值)左右。

wKioL1gZWfCD_61uAAGL7nuZJOM045.jpg-wh_50


解决问题:

将较大的日志从mongodb服务器分离出。

将小日子日志脚本切割改成系统logrotate切割。logrotate会在系统空闲的状态进行操做。



但是为何拷贝了一个3g的文件,就会致使cpu load 高达10. 进而致使mongodb查询性能直线降低。

因而咱们联系了某云,一个普通云盘的性能怎会如此低!


以上查问题的思路,最开始也没有很顺利。起初文件较小并无猜想到是日志拷贝。查问题的时候不能以惯性思惟排除。

相关文章
相关标签/搜索