mongodb 对内存的严重占用以及解决方法【转载】

时间 2019-12-24

原文原文链接

mongodb 对内存的严重占用以及解决方法【转载】

刚开始使用mongodb的时候，不太注意mongodb的内存使用，但经过查资料发现mongodb对内存的占用是巨大的，在本地测试服务器中，8G的内存竟然被占用了45%。汗呀。
本文就来剖析一下mongodb对内存的具体使用方法，以及生产环境针对mongodb占大量内存的问题的解决。
先看一个MongoDB服务器的top命令结果
shell> top -p $(pidof mongod)
Mem: 32872124k total, 30065320k used, 2806804k free,   245020k buffers
Swap: 2097144k total,      100k used, 2097044k free, 26482048k cached
VIRT RES SHR %MEM
1892g 21g 21g 69.6

或者先top后，而后 shift+m 把当前进场按占用内存的多少排序。看看你的mongodb能占用多少内存。

先了解一下linux对内存的管理方式：
在Linux里（别的系统也差很少），内存有物理内存和虚拟内存之说，物理内存是什么天然无需解释，虚拟内存实际是物理内存的抽象，多数状况下，出于方便性的考虑，程序访问的都是虚拟内存地址，而后操做系统会把它翻译成物理内存地址。
不少人会把虚拟内存和Swap混为一谈，实际上Swap只是虚拟内存引伸出的一种技术而已：操做系统一旦物理内存不足，为了腾出内存空间存放新内容，就会把当前物理内存中的内容放到交换分区里，稍后用到的时候再取回来，须要注意的是，Swap的使用可能会带来性能问题，偶尔为之无需紧张，糟糕的是物理内存和交换分区频繁的发生数据交换，这被称之为Swap颠簸，一旦发生这种状况，先要明确是什么缘由形成的，若是是内存不足就好办了，加内存就能够解决，不过有的时候即便内存充足也可能会出现这种问题，好比MySQL就有可能出现这样的状况，解决方法是限制使用Swap：
shell> sysctl -w vm.swappiness=0
查看内存状况最经常使用的是free命令：
shell> free -m
             total       used       free     shared    buffers     cached
Mem:         32101      29377       2723          0        239      25880
-/+ buffers/cache:       3258      28842
Swap:         2047          0       2047
新手看到used一栏数值偏大，free一栏数值偏小，每每会认为内存要用光了。其实并不是如此，之因此这样是由于每当咱们操做文件的时候，Linux都会尽量的把文件缓存到内存里，这样下次访问的时候，就能够直接从内存中取结果，因此cached一栏的数值很是的大，不过不用担忧，这部份内存是可回收的，操做系统会按照LRU算法淘汰冷数据。除了cached，还有一个buffers，它和cached相似，也是可回收的，不过它的侧重点在于缓解不一样设备的操做速度不一致形成的阻塞，这里就很少作解释了。
知道了原理，咱们就能够推算出系统可用的内存是free + buffers + cached：
shell> echo "2723 + 239 + 25880" | bc -l
28842
至于系统实际使用的内存是used – buffers – cached：
shell> echo "29377 - 239 - 25880" | bc -l
3258
除了free命令，还可使用sar命令：
shell> sar -r
kbmemfree kbmemused %memused kbbuffers kbcached
3224392 29647732     90.19    246116 26070160
3116324 29755800     90.52    245992 26157372
2959520 29912604     91.00    245556 26316396
2792248 30079876     91.51    245680 26485672
2718260 30153864     91.73    245684 26563540

shell> sar -W
pswpin/s pswpout/s
    0.00      0.00
    0.00      0.00
    0.00      0.00
    0.00      0.00
    0.00      0.00
但愿你没有被%memused吓到，若是不幸言中，请参考free命令的解释。

接着我们分析一下mongodb是怎么使用内存的：

目前，MongoDB使用的是内存映射存储引擎，它会把磁盘IO操做转换成内存操做，若是是读操做，内存中的数据起到缓存的做用，若是是写操做，内存还能够把随机的写操做转换成顺序的写操做，总之能够大幅度提高性能。MongoDB并不干涉内存管理工做，而是把这些工做留给操做系统的虚拟缓存管理器去处理，这样的好处是简化了MongoDB的工做，但坏处是你没有方法很方便的控制MongoDB占多大内存，事实上MongoDB会占用全部能用的内存，因此最好不要把别的服务和MongoDB放一块儿。

有时候，即使MongoDB使用的是64位操做系统，也可能会遭遇臭名昭著的OOM问题，出现这种状况，多半是由于限制了虚拟内存的大小所致，能够这样查看当前值：

shell> ulimit -a | grep 'virtual'
多数操做系统缺省都是把它设置成unlimited的，若是你的操做系统不是，能够这样修改：

shell> ulimit -v unlimited
不过要注意的是，ulimit的使用是有上下文的，最好放在MongoDB的启动脚本里。

有时候，出于某些缘由，你可能想释放掉MongoDB占用的内存，不过前面说了，内存管理工做是由虚拟内存管理器控制的，因此一般你只能经过重启服务来释放内存，你必定不齿于这样的方法，幸亏可使用MongoDB内置的closeAllDatabases命令达到目的：

mongo> use admin
mongo> db.runCommand({closeAllDatabases:1})
另外，经过调整内核参数drop_caches也能够释放缓存：

shell> sysctl -w vm.drop_caches=1
平时能够经过mongo命令行来监控MongoDB的内存使用状况，以下所示：

mongo> db.serverStatus().mem:
{
    "resident" : 22346,
    "virtual" : 1938524,
    "mapped" : 962283
}
还能够经过mongostat命令来监控MongoDB的内存使用状况，以下所示：
shell> mongostat
mapped vsize    res faults
940g 1893g 21.9g      0
940g 1893g 21.9g      0
940g 1893g 21.9g      0
940g 1893g 21.9g      0
940g 1893g 21.9g      0

其中内存相关字段的含义是：
mapped：映射到内存的数据大小
visze：占用的虚拟内存大小
res：实际使用的内存大小
注：若是操做不能再内存中完成，结果faults列的数值不会是0，视大小可能有性能问题。

在上面的结果中，vsize是mapped的两倍，而mapped等于数据文件的大小，因此说vsize是数据文件的两倍，之因此会这样，是由于本例中，MongoDB开启了journal，须要在内存里多映射一次数据文件，若是关闭journal，则vsize和mapped大体至关。

若是想验证这一点，能够在开启或关闭journal后，经过pmap命令来观察文件映射状况：
shell> pmap $(pidof mongod)
到底MongoDB配备多大内存合适？宽泛点来讲，多多益善，若是要确切点来讲，这实际取决于你的数据及索引的大小，内存若是可以装下所有数据加索引是最佳状况，不过不少时候，数据都会比内存大，好比本文说涉及的MongoDB实例：
mongo> db.stats()
{
        "dataSize" : 1004862191980,
        "indexSize" : 1335929664
}
本例中索引只有1G多，内存彻底能装下，而数据文件则达到了1T，估计很难找到这么大内存，此时保证内存能装下热数据便可，至于热数据有多少，这就是个比例问题了，取决于具体的应用。如此一来内存大小就明确了：内存 > 索引 + 热数据。

根据以上的分析咱们能够得出几点结论：
1. mongodb 直接用操做系统的内存管理器来管理内存。而操做系统采用的是LRU算法淘汰冷数据。
2. mongodb能够用重启服务、调整内核参数以及mongodb内部的语法去清理mongodb对内存的缓存。可能存在的问题是：这几种清理方式都是所有清理，这样的话mongodb的内存缓存就失效了。
3. mongodb 对内存的使用是能够被监控的，在生产环境中要定时的去监控这些数据。
4. mongodb 对内存这种占用方式使其尽可能的和其余占用内存的业务分开部署，例如memcahe，sphinx，mysql等。
5. 操做系统中的交换分区swap 若是操做频繁的话，会严重下降系统效率。要解决能够禁用交换分区，以及增长内存以及作分布式。
6. 生产环境中mongodb所在的主机应该尽可能的大内存。 mysql