欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

基于MongoDB数据库索引构建情况全面分析

程序员文章站 2022-06-15 21:41:36
前面的话 本文将详细介绍mongodb数据库索引构建情况分析 概述 创建索引可以加快索引相关的查询,但是会增加磁盘空间的消耗,降低写入性能。这时,就需要评判当前索引的...

前面的话

本文将详细介绍mongodb数据库索引构建情况分析

概述

创建索引可以加快索引相关的查询,但是会增加磁盘空间的消耗,降低写入性能。这时,就需要评判当前索引的构建情况是否合理。有4种方法可以使用

1、mongostat工具

2、profile集合介绍

3、日志

4、explain分析

mongostat

mongostat是mongodb自带的状态检测工具,在命令行下使用。它会间隔固定时间获取mongodb的当前运行状态,并输出。如果发现数据库突然变慢或者有其他问题的话,首先就要考虑采用mongostat来查看mongo的状态

mongostat是查看mongodb运行状态的程序,使用方式如下

mongostat -h ip:port

【字段说明】

insert/s : 每秒插入数据库的对象数量,如果是slave,则数值前有*,则表示复制集操作
query/s : 每秒的查询操作次数
update/s : 每秒的更新操作次数
delete/s : 每秒的删除操作次数
getmore/s: 每秒查询cursor(游标)时的getmore操作数
command: 每秒执行的命令数,在主从系统中会显示两个值(例如 3|0),分别代表 本地|复制 命令
dirty: 脏数据字节的缓存百分比
used:正在使用中的缓存百分比
flushes:checkpoint的触发次数在一个轮询间隔期间。一般都是0,间断性会是1, 通过计算两个1之间的间隔时间,可以大致了解多长时间flush一次。flush开销是很大的,如果频繁的flush,可能就要找找原因了
vsize: 虚拟内存使用量,单位mb 
res: 物理内存使用量,单位mb。 res会慢慢的上升,如果res经常突然下降,要查看下是否有别的程序狂吃内存
qr: 客户端等待从mongodb实例读数据的队列长度
qw:客户端等待从mongodb实例写入数据的队列长度
ar: 执行读操作的活跃客户端数量
aw: 执行写操作的活客户端数量。如果ar或aw数值很大,那么就是db被堵住了,db的处理速度不及请求速度。查看是否有开销很大的慢查询。如果查询一切正常,确实是负载很大,就需要加机器了
netin:mongodb实例的网络进流量
netout:mongodb实例的网络出流量
conn: 打开连接的总数,是qr,qw,ar,aw的总和
time:当前时间

【实例】

插入100000条数据,并打开mongostat查询mongodb运行状态

基于MongoDB数据库索引构建情况全面分析

由下图看出,插入值insert值在插入数据时大量增加,在插入完毕后变成0。flush两个1之间的间隔时间很长,说明性能还不错;res在慢慢上升,没有出现突然下降的情况,说明没有其他的程序大量占用内容的情况;qrw及arw数据很小,说明数据库读写状态正常,负载较小。总体而言,mongodb数据库运行状态良好

基于MongoDB数据库索引构建情况全面分析

profile

mongodb可以通过profile来监控数据,进行优化

【级别】

首先,要查看当前是否开启profile功能

使用下面的命令会返回level等级,值为0|1|2,0代表关闭,即不记录任何操作;1代表记录慢命令(默认值为100ms),即记录运行时间超过100ms的操作;2代表全部,即记录任何操作

db.getprofilinglevel() 

使用下面的命令可以设置level等级

db.setprofilinglevel() 

如下图所示,默认地,profile关闭。使用setprofilinglevel()方法以50ms慢命令的方式开启profile

基于MongoDB数据库索引构建情况全面分析

【状态】

操作被记录到system.profile集合中

基于MongoDB数据库索引构建情况全面分析

通过db.system.profile.find() 查看当前的监控日志

基于MongoDB数据库索引构建情况全面分析
基于MongoDB数据库索引构建情况全面分析
op:操作类型
ns:命名空间
query:查询字符串
responselength:返回长度
ts:时间
mills:执行耗时

【使用】

在系统中开启profile之后,如果profile记录的数据非常大,会比较明显的降低系统的性能。因此,profile的使用场景一般是新系统上线之前的测试阶段,以及刚上线时的观察阶段,查看数据库的设计及应用程序的使用是否正常。如果profile记录了大量的字段,需要调整系统附在、调整索引等,减小它的大小

日志

在配置日志文件时,可以使用verbose参数来配置日志详细程度,参数值从'v'到'vvvvv','v'越多,详细度越高

日志会记录mongodb的运行状态,包括连接时间、当前正在进行的操作等

基于MongoDB数据库索引构建情况全面分析

explain

mongodb 提供了一个 explain 命令让我们获知系统如何处理查询请求。利用 explain 命令,可以很好地观察系统如何使用索引来加快检索,同时可以针对性优化索引

explain有三种模式,分别是:queryplanner、executionstats、allplansexecution。现实开发中,常用的是executionstats模式

首先,插入10万条数据

基于MongoDB数据库索引构建情况全面分析

在time字段上建立索引

基于MongoDB数据库索引构建情况全面分析

接着,寻找time范围在100和200之间的文档,并使用explain()

结果分为queryplanner、executionstats和serverinfo三个部分。接下来,将分别对这三个部分的结果进行详细分析

【queryplanner】

基于MongoDB数据库索引构建情况全面分析

queryplanner.plannerversion: 版本

queryplanner.namespace: 查询的表

queryplanner.indexfilterset: 针对该query是否有indexfilter

queryplanner.parsedquery: 查询条件

queryplanner.winningplan: 查询优化器针对该query所返回的最优执行计划的详细内容

queryplanner.winningplan.stage: 最优执行计划的stage

queryplanner.winningplan.inputstage: 用来描述子stage,并且为其父stage提供文档和索引关键字。

queryplanner.winningplan.inputstage.stage,此处是ixscan,表示进行的是index scanning

queryplanner.winningplan.inputstage.keypattern: 索引键值对

queryplanner.winningplan.inputstage.indexname:索引名称

queryplanner.winningplan.inputstage.ismultikey: 是否是multikey,此处返回是false,如果索引建立在array上,此处将是true

queryplanner.winningplan.inputstage.direction:查询顺序,此处是forward,如果用了.sort({time:-1})将显示backward

queryplanner.winningplan.inputstage.indexbounds: 所扫描的索引范围

queryplanner.rejectedplans:其他执行计划

【executionstats】

基于MongoDB数据库索引构建情况全面分析

executionstats.executionsuccess: 是否成功

executionstats.nreturned: 查询返回条目个数

executionstats.totalkeysexamined: 索引扫描条目个数

executionstats.totaldocsexamined: 文档扫描条目个数

executionstats.executionstages.stage: 扫描类型

executionstats.executiontimemillis: 整体查询时间

executionstats.executionstages.executiontimemillisestimate: 根据索引检索文档获得数据的时间

executionstats.executionstages.inputstage.executiontimemillisestimate: 扫描索引所用时间

【serverinfo】

基于MongoDB数据库索引构建情况全面分析

serverinfo.host: 主机名

serverinfo.port: 端口

serverinfo.version: 版本

serverinfo.gitversion: git版本

【性能分析】

1、执行时间

executiontimemillis值越小越好

2、条目数量

最理想的状态是: nreturned=totalkeysexamined=totaldocsexamined

3、stage类型

stage的类型列举如下:

collscan:全表扫描
ixscan:索引扫描
fetch:根据索引去检索指定document
shard_merge:将各个分片返回数据进行merge
sort:表明在内存中进行了排序
limit:使用limit限制返回数
skip:使用skip进行跳过
idhack:针对_id进行查询
sharding_filter:通过mongos对分片数据进行查询
count:利用db.coll.explain().count()之类进行count运算
countscan:count不使用index进行count时的stage返回
count_scan:count使用了index进行count时的stage返回
subpla:未使用到索引的$or查询的stage返回
text:使用全文索引进行查询时候的stage返回
projection:限定返回字段时候stage的返回

不希望看到包含如下的stage:

collscan(全表扫描)
sort(使用sort但是无index)
不合理的skip
subpla(未用到index的$or)
countscan(不使用index进行count)

以上这篇基于mongodb数据库索引构建情况全面分析就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。