MongoDB运行状态监控、性能分析工具mongostat详解
这篇文章的目的是让你知道怎么了解你正在运行的mongdb是否健康。
mongostat详解
mongostat是mongdb自带的状态检测工具,在命令行下使用。它会间隔固定时间获取mongodb的当前运行状态,并输出。如果你发现数据库突然变慢或者有其他问题的话,你第一手的操作就考虑采用mongostat来查看mongo的状态。
它的输出有以下几列:
1.inserts/s 每秒插入次数
2.query/s 每秒查询次数
3.update/s 每秒更新次数
4.delete/s 每秒删除次数
5.getmore/s 每秒执行getmore次数
6.command/s 每秒的命令数,比以上插入、查找、更新、删除的综合还多,还统计了别的命令
7.flushs/s 每秒执行fsync将数据写入硬盘的次数。
8.mapped/s 所有的被mmap的数据量,单位是mb,
9.vsize 虚拟内存使用量,单位mb
10.res 物理内存使用量,单位mb
11.faults/s 每秒访问失败数(只有linux有),数据被交换出物理内存,放到swap。不要超过100,否则就是机器内存太小,造成频繁swap写入。此时要升级内存或者扩展
12.locked % 被锁的时间百分比,尽量控制在50%以下吧
13.idx miss % 索引不命中所占百分比。如果太高的话就要考虑索引是不是少了
14.q t|r|w 当mongodb接收到太多的命令而数据库被锁住无法执行完成,它会将命令加入队列。这一栏显示了总共、读、写3个队列的长度,都为0的话表示mongo毫无压力。高并发时,一般队列值会升高。
15.conn 当前连接数
16.time 时间戳
使用profiler
似于mysql的slow log, mongodb可以监控所有慢的以及不慢的查询。
profiler默认是关闭的,你可以选择全部开启,或者有慢查询的时候开启。
> use test
switched to db test
> db.setprofilinglevel(2);
{"was" : 0 , "slowms" : 100, "ok" : 1} // "was" is the old setting
> db.getprofilinglevel()
2
查看profile日志
> db.system.profile.find().sort({$natural:-1})
{"ts" : "thu jan 29 2009 15:19:32 gmt-0500 (est)" , "info" :
"query test.$cmd ntoreturn:1 reslen:66 nscanned:0 query: { profile: 2 } nreturned:1 bytes:50" ,
"millis" : 0}
3个字段的意义
1.ts:时间戳
2.info:具体的操作
3.millis:操作所花时间,毫秒
不多说,此处有官方文档。注意,造成满查询可能是索引的问题,也可能是数据不在内存造成因此磁盘读入造成。
使用web控制台
mongodb自带了web控制台,默认和数据服务一同开启。他的端口在mongodb数据库服务器端口的基础上加1000,如果是默认的mongodb数据服务端口(which is 27017),则相应的web端口为28017
这个页面可以看到
1.当前mongodb的所有连接
2.各个数据库和collection的访问统计,包括:reads, writes, queries, getmores ,inserts, updates, removes
3.写锁的状态
4.以及日志文件的最后几百行(centos+10gen yum 安装的mongodb默认的日志文件位于/var/log/mongo/mongod.log)
可以参考右边的截图
db.stat()
获取当前数据库的信息,比如obj总数、数据库总大小、平均obj大小等
> use test
switched to db test
> db.stats()
{
"collections" : 9,
"objects" : 4278845,
"avgobjsize" : 224.56603031892953,
"datasize" : 960883236,
"storagesize" : 1195438080,
"numextents" : 59,
"indexes" : 13,
"indexsize" : 801931264,
"filesize" : 6373244928,
"ok" : 1
}
db.serverstatus()
获取服务器的状态
{
"version" : "1.6.5",
"uptime" : 7208469,
"uptimeestimate" : 7138829,
"localtime" : "wed oct 26 2011 22:23:07 gmt+0800 (cst)",
"globallock" : {
"totaltime" : 7208469556704,
"locktime" : 4959693717,
"ratio" : 0.000688036992871448,
"currentqueue" : {
"total" : 0,
"readers" : 0,
"writers" : 0
}
},
"mem" : {
"bits" : 64,
"resident" : 3131,
"virtual" : 6172,
"supported" : true,
"mapped" : 4927
},
"connections" : {
"current" : 402,
"available" : 2599
},
"extra_info" : {
"note" : "fields vary by platform",
"heap_usage_bytes" : 832531920,
"page_faults" : 8757
},
"indexcounters" : {
"btree" : {
"accesses" : 2821726,
"hits" : 2821725,
"misses" : 1,
"resets" : 0,
"missratio" : 3.543930204420982e-7
}
},
"backgroundflushing" : {
"flushes" : 120133,
"total_ms" : 73235923,
"average_ms" : 609.6236920746173,
"last_ms" : 1332,
"last_finished" : "wed oct 26 2011 22:22:23 gmt+0800 (cst)"
},
"cursors" : {
"totalopen" : 0,
"clientcursors_size" : 0,
"timedout" : 238392
},
"repl" : {
"ismaster" : true
},
"opcounters" : {
"insert" : 269351,
"query" : 19331151,
"update" : 14199331,
"delete" : 1,
"getmore" : 145575,
"command" : 55982302
},
"asserts" : {
"regular" : 0,
"warning" : 0,
"msg" : 0,
"user" : 27,
"rollovers" : 0
},
"ok" : 1
}
需要关心的地方:
1.connections 当前连接和可用连接数,听过一个同行介绍过,mongodb最大处理到2000个连接就不行了(要根据你的机器性能和业务来设定),所以设大了没意义。设个合理值的话,到达这个值mongodb就拒绝新的连接请求,避免被太多的连接拖垮。
2.indexcounters:btree:misses 索引的不命中数,和hits的比例高就要考虑索引是否正确建立。你看我的”missratio” : 3.543930204420982e-7,很健康吧。所以miss率在mongostat里面也可以看
3.其他的都能自解释,也不是查看mongo健康状况的关键,就不说明了。
db.currentop()
mongodb 的命令一般很快就完成,但是在一台繁忙的机器或者有比较慢的命令时,你可以通过db.currentop()获取当前正在执行的操作。
在没有负载的机器上,该命令基本上都是返回空的
> db.currentop()
{ "inprog" : [ ] }
以下是一个有负载的机器上得到的返回值样例:
{ "opid" : "shard3:466404288", "active" : false, "waitingforlock" : false, "op" : "query", "ns" : "sd.usersemails", "query" : { }, "client_s" : "10.121.13.8:34473", "desc" : "conn" },
字段名字都能自解释。如果你发现一个操作太长,把数据库卡死的话,可以用这个命令杀死他
> db.killop("shard3:466404288")
mongodb monitoring service
mongodb monitoring service(mms)是mongodb厂商提供的监控服务,可以在网页和android客户端上监控你的mongodb状况。
上一篇: MongoDB的一些常用查询方法