mongodb 对内存的严重占用以及解决方法【转载】
刚开始使用mongodb的时候,不太注意mongodb的内存使用,但经过查资料发现mongodb对内存的占用是巨大的,在本地测试服务器中,8G的内存竟然被占用了45%。汗呀。
本文就来剖析一下mongodb对内存的具体使用方法,以及生产环境针对mongodb占大量内存的问题的解决。
先看一个MongoDB服务器的top命令结果
shell> top -p $(pidof mongod)
Mem: 32872124k total, 30065320k used, 2806804k free, 245020k buffers
Swap: 2097144k total, 100k used, 2097044k free, 26482048k cached
VIRT RES SHR %MEM
1892g 21g 21g 69.6
或者 先top后,而后 shift+m 把当前进场按占用内存的多少排序。看看你的mongodb能占用多少内存。
先了解一下linux对内存的管理方式:
在Linux里(别的系统也差很少),内存有物理内存和虚拟内存之说,物理内存是什么天然无需解释,虚拟内存实际是物理内存的抽象,多数状况下,出于方便性的考虑,程序访问的都是虚拟内存地址,而后操做系统会把它翻译成物理内存地址。
不少人会把虚拟内存和Swap混为一谈,实际上Swap只是虚拟内存引伸出的一种技术而已:操做系统一旦物理内存不足,为了腾出内存空间存放新内容,就会把当前物理内存中的内容放到交换分区里,稍后用到的时候再取回来,须要注意的是,Swap的使用可能会带来性能问题,偶尔为之无需紧张,糟糕的是物理内存和交换分区频繁的发生数据交换,这被称之为Swap颠簸,一旦发生这种状况,先要明确是什么缘由形成的,若是是内存不足就好办了,加内存就能够解决,不过有的时候即便内存充足也可能会出现这种问题,好比MySQL就有可能出现这样的状况,解决方法是限制使用Swap:
shell> sysctl -w vm.swappiness=0
查看内存状况最经常使用的是free命令:
shell> free -m
total used free shared buffers cached
Mem: 32101 29377 2723 0 239 25880
-/+ buffers/cache: 3258 28842
Swap: 2047 0 2047
新手看到used一栏数值偏大,free一栏数值偏小,每每会认为内存要用光了。其实并不是如此,之因此这样是由于每当咱们操做文件的时候,Linux都会尽量的把文件缓存到内存里,这样下次访问的时候,就能够直接从内存中取结果,因此cached一栏的数值很是的大,不过不用担忧,这部份内存是可回收的,操做系统会按照LRU算法淘汰冷数据。除了cached,还有一个buffers,它和cached相似,也是可回收的,不过它的侧重点在于缓解不一样设备的操做速度不一致形成的阻塞,这里就很少作解释了。
知道了原理,咱们就能够推算出系统可用的内存是free + buffers + cached:
shell> echo "2723 + 239 + 25880" | bc -l
28842
至于系统实际使用的内存是used – buffers – cached:
shell> echo "29377 - 239 - 25880" | bc -l
3258
除了free命令,还可使用sar命令:
shell> sar -r
kbmemfree kbmemused %memused kbbuffers kbcached
3224392 29647732 90.19 246116 26070160
3116324 29755800 90.52 245992 26157372
2959520 29912604 91.00 245556 26316396
2792248 30079876 91.51 245680 26485672
2718260 30153864 91.73 245684 26563540
shell> sar -W
pswpin/s pswpout/s
0.00 0.00
0.00 0.00
0.00 0.00
0.00 0.00
0.00 0.00
但愿你没有被%memused吓到,若是不幸言中,请参考free命令的解释。
接着我们分析一下mongodb是怎么使用内存的:
目前,MongoDB使用的是内存映射存储引擎,它会把磁盘IO操做转换成内存操做,若是是读操做,内存中的数据起到缓存的做用,若是是写操做,内存还能够把随机的写操做转换成顺序的写操做,总之能够大幅度提高性能。MongoDB并不干涉内存管理工做,而是把这些工做留给操做系统的虚拟缓存管理器去处理,这样的好处是简化了MongoDB的工做,但坏处是你没有方法很方便的控制MongoDB占多大内存,事实上MongoDB会占用全部能用的内存,因此最好不要把别的服务和MongoDB放一块儿。
有时候,即使MongoDB使用的是64位操做系统,也可能会遭遇臭名昭著的OOM问题,出现这种状况,多半是由于限制了虚拟内存的大小所致,能够这样查看当前值:
shell> ulimit -a | grep 'virtual'
多数操做系统缺省都是把它设置成unlimited的,若是你的操做系统不是,能够这样修改:
shell> ulimit -v unlimited
不过要注意的是,ulimit的使用是有上下文的,最好放在MongoDB的启动脚本里。
有时候,出于某些缘由,你可能想释放掉MongoDB占用的内存,不过前面说了,内存管理工做是由虚拟内存管理器控制的,因此一般你只能经过重启服务来释放内存,你必定不齿于这样的方法,幸亏可使用MongoDB内置的closeAllDatabases命令达到目的:
mongo> use admin
mongo> db.runCommand({closeAllDatabases:1})
另外,经过调整内核参数drop_caches也能够释放缓存:
shell> sysctl -w vm.drop_caches=1
平时能够经过mongo命令行来监控MongoDB的内存使用状况,以下所示:
mongo> db.serverStatus().mem:
{
"resident" : 22346,
"virtual" : 1938524,
"mapped" : 962283
}
还能够经过mongostat命令来监控MongoDB的内存使用状况,以下所示:
shell> mongostat
mapped vsize res faults
940g 1893g 21.9g 0
940g 1893g 21.9g 0
940g 1893g 21.9g 0
940g 1893g 21.9g 0
940g 1893g 21.9g 0
其中内存相关字段的含义是:
mapped:映射到内存的数据大小
visze:占用的虚拟内存大小
res:实际使用的内存大小
注:若是操做不能再内存中完成,结果faults列的数值不会是0,视大小可能有性能问题。
在上面的结果中,vsize是mapped的两倍,而mapped等于数据文件的大小,因此说vsize是数据文件的两倍,之因此会这样,是由于本例中,MongoDB开启了journal,须要在内存里多映射一次数据文件,若是关闭journal,则vsize和mapped大体至关。
若是想验证这一点,能够在开启或关闭journal后,经过pmap命令来观察文件映射状况:
shell> pmap $(pidof mongod)
到底MongoDB配备多大内存合适?宽泛点来讲,多多益善,若是要确切点来讲,这实际取决于你的数据及索引的大小,内存若是可以装下所有数据加索引是最佳状况,不过不少时候,数据都会比内存大,好比本文说涉及的MongoDB实例:
mongo> db.stats()
{
"dataSize" : 1004862191980,
"indexSize" : 1335929664
}
本例中索引只有1G多,内存彻底能装下,而数据文件则达到了1T,估计很难找到这么大内存,此时保证内存能装下热数据便可,至于热数据有多少,这就是个比例问题了,取决于具体的应用。如此一来内存大小就明确了:内存 > 索引 + 热数据。
根据以上的分析咱们能够得出几点结论:
1. mongodb 直接用操做系统的内存管理器来管理内存。而操做系统采用的是LRU算法淘汰冷数据。
2. mongodb能够用重启服务、调整内核参数以及mongodb内部的语法去清理mongodb对内存的缓存。可能存在的问题是:这几种清理方式都是所有清理,这样的话mongodb的内存缓存就失效了。
3. mongodb 对内存的使用是能够被监控的,在生产环境中要定时的去监控这些数据。
4. mongodb 对内存这种占用方式使其尽可能的和其余占用内存的业务分开部署,例如memcahe,sphinx,mysql等。
5. 操做系统中的交换分区swap 若是操做频繁的话,会严重下降系统效率。要解决能够禁用交换分区,以及增长内存以及作分布式。
6. 生产环境中mongodb所在的主机应该尽可能的大内存。 mysql