MongoDB监控优化

你的MongoDB是否健康?
mongodb

mongostat

     mongostat是mongdb自带的状态检测工具,在命令行下使用。它会间隔固定时间获取mongodb的当前运行状态,并输出。若是你发现数据库忽然变慢或者有其余问题的话,你第一手的操做就考虑采用mongostat来查看mongo的状态。数据库

它的输出有如下几列:服务器

  • inserts/s 每秒插入次数网络

  • query/s 每秒查询次数并发

  • update/s 每秒更新次数app

  • delete/s 每秒删除次数ide

  • getmore/s 每秒执行getmore次数高并发

  • command/s 每秒的命令数,比以上插入、查找、更新、删除的综合还多,还统计了别的命令工具

  • flushs/s 每秒执行fsync将数据写入硬盘的次数。性能

  • mapped/s 全部的被mmap的数据量,单位是MB,

  • vsize 虚拟内存使用量,单位MB

  • res 物理内存使用量,单位MB

  • faults/s 每秒访问失败数(只有Linux有),数据被交换出物理内存,放到swap。不要超过100,不然就是机器内存过小,形成频繁swap写入。此时要升级内存或者扩展

  • locked % 被锁的时间百分比,尽可能控制在50%如下吧

  • idx miss % 索引不命中所占百分比。若是过高的话就要考虑索引是否是少了

  • q t|r|w 当Mongodb接收到太多的命令而数据库被锁住没法执行完成,它会将命令加入队列。这一栏显示了总共、读、写3个队列的长度,都为0的话表示mongo毫无压力。高并发时,通常队列值会升高。

  • conn 当前链接数

  • time 时间戳

Profiler

profiler能够监控具体某个数据库查询慢的以及不慢。

Profiler默认是关闭的,你能够选择所有开启,或者有慢查询的时候开启。

> use test
switched to db test
> db.setProfilingLevel(2);
{"was" : 0 , "slowms" : 100, "ok" : 1} // "was" is the old setting
> db.getProfilingLevel()

查看Profile日志

> db.system.profile.find().sort({$natural:-1})
{"ts" : "Thu Jan 29 2009 15:19:32 GMT-0500 (EST)" , "info" :
"query test.$cmd ntoreturn:1 reslen:66 nscanned:0 query: { profile: 2 } nreturned:1 bytes:50" ,
"millis" : 0} ...

3个字段的意义

  • ts:时间戳

  • info:具体的操做

  • millis:操做所花时间,毫秒

很少说,此处有官方文档。注意,形成满查询多是索引的问题,也多是数据不在内存形成所以磁盘读入形成。

使用Web控制台

Mongodb自带了Web控制台,默认和数据服务一同开启。他的端口在Mongodb数据库服务器端口的基础上加1000,若是是默认的Mongodb数据服务端口(Which is 27017),则相应的Web端口为28017

这个页面能够看到

  • 当前Mongodb的全部链接

  • 各个数据库和Collection的访问统计,包括:Reads, Writes, Queries, GetMores ,Inserts, Updates, Removes

  • 写锁的状态

  • 以及日志文件的最后几百行(CentOS+10gen yum 安装的mongodb默认的日志文件位于/var/log/mongo/mongod.log)


mongosniff

       Sniffer,中文能够翻译为嗅探器,是一种基于被动侦听原理的网络分析方式。使用这种技术方式,能够监视网络的状态、数据流动状况以及网络上传输的信息。

Mongodb提供了一个sniffer工具:mongosniff,这个工具能够从底层监控有哪些命令传送给了Mongodb,祥见官网: http://docs.mongodb.org/manual/reference/program/mongosniff/ 

mongotop

       mongotop提供了一个方法,用来跟踪一个MongoDB的实例,查看哪些大量的时间花费在读取和写入数据

db.stat()


获取当前数据库的信息,好比Obj总数、数据库总大小、平均Obj大小等

> use test
switched to db test
> db.stats()
{
    "collections" : 9,
    "objects" : 4278845,
    "avgObjSize" : 224.56603031892953,
    "dataSize" : 960883236,
    "storageSize" : 1195438080,
    "numExtents" : 59,
    "indexes" : 13,
    "indexSize" : 801931264,
    "fileSize" : 6373244928,
    "ok" : 1
}

db.serverStatus()


获取服务器的状态

{
    "version" : "1.6.5",
    "uptime" : 7208469,
    "uptimeEstimate" : 7138829,
    "localTime" : "Wed Oct 26 2011 22:23:07 GMT+0800 (CST)",
    "globalLock" : {
        "totalTime" : 7208469556704,
        "lockTime" : 4959693717,
        "ratio" : 0.000688036992871448,
        "currentQueue" : {
            "total" : 0,
            "readers" : 0,
            "writers" : 0
        }
    },
    "mem" : {
        "bits" : 64,
        "resident" : 3131,
        "virtual" : 6172,
        "supported" : true,
        "mapped" : 4927
    },
    "connections" : {
        "current" : 402,
        "available" : 2599
    },
    "extra_info" : {
        "note" : "fields vary by platform",
        "heap_usage_bytes" : 832531920,
        "page_faults" : 8757
    },
    "indexCounters" : {
        "btree" : {
            "accesses" : 2821726,
            "hits" : 2821725,
            "misses" : 1,
            "resets" : 0,
            "missRatio" : 3.543930204420982e-7
        }
    },
    "backgroundFlushing" : {
        "flushes" : 120133,
        "total_ms" : 73235923,
        "average_ms" : 609.6236920746173,
        "last_ms" : 1332,
        "last_finished" : "Wed Oct 26 2011 22:22:23 GMT+0800 (CST)"
    },
    "cursors" : {
        "totalOpen" : 0,
        "clientCursors_size" : 0,
        "timedOut" : 238392
    },
    "repl" : {
        "ismaster" : true
    },
    "opcounters" : {
        "insert" : 269351,
        "query" : 19331151,
        "update" : 14199331,
        "delete" : 1,
        "getmore" : 145575,
        "command" : 55982302
    },
    "asserts" : {
        "regular" : 0,
        "warning" : 0,
        "msg" : 0,
        "user" : 27,
        "rollovers" : 0
    },
    "ok" : 1
}

须要关心的地方:

  • connections 当前链接和可用链接数,听过一个同行介绍过,mongodb最大处理到2000个链接就不行了(要根据你的机器性能和业务来设定),因此设大了没意义。设个合理值的话,到达这个值mongodb就拒绝新的链接请求,避免被太多的链接拖垮。

  • indexCounters:btree:misses 索引的不命中数,和hits的比例高就要考虑索引是否正确创建。你看个人”missRatio” : 3.543930204420982e-7,很健康吧。因此miss率在mongostat里面也能够看

  • 其余的都能自解释,也不是查看mongo健康情况的关键,就不说明了。

db.currentOp()


Mongodb 的命令通常很快就完成,可是在一台繁忙的机器或者有比较慢的命令时,你能够经过db.currentOp()获取当前正在执行的操做

在没有负载的机器上,该命令基本上都是返回空的, 在负载很高的状况下,可能意义也不是特别的大

>  db.currentOp()
{ "inprog" : [ ] }

如下是一个有负载的机器上获得的返回值样例:

{ "opid" : "shard3:466404288", "active" : false, "waitingForLock" : false, "op" : "query", "ns" : "sd.usersEmails", "query" : { }, "client_s" : "10.121.13.8:34473", "desc" : "conn" },

字段名字都能自解释。若是你发现一个操做太长,把数据库卡死的话,能够用这个命令杀死他

> db.killOp("shard3:466404288")
相关文章
相关标签/搜索