欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

MongoDB数据库中索引和explain的使用教程

程序员文章站 2022-03-23 23:49:37
前言 本文主要给大家介绍了关于mongodb中索引和explain使用的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍: mongodb 索引使...

前言

本文主要给大家介绍了关于mongodb中索引和explain使用的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍:

mongodb 索引使用

作用

  • 索引通常能够极大的提高查询。
  • 索引是一种数据结构,他搜集一个集合中文档特定字段的值。
  • b-tree索引来实现。

创建索引

db.collection.createindex(keys, options)

keys

  • keys由文档字段和索引类型组成。如{"name":1}
  • key 表示字段 value 1,-1  1表示升序,-1降序

options

options 创建索引的选项。

参数 类型 描述
background boolean 创建索引在后台运行,不会阻止其他对数据库操作
unique boolean 创建唯一索引,文档的值不会重复
name string 索引名称,默认是:字段名_排序类型 开始排序
sparse boolean 过滤掉null,不存在的字段

查看索引

 db.collection.getindexes()
 {
  "v" : 1,
  "key" : {
   "_id" : 1
  },
  "name" : "_id_",
  "ns" : "leyue.userdatas"
 },
 {
  "v" : 1,
  "key" : {
   "name" : 1 //索引字段
  },
  "name" : "name_1", //索引名称
  "ns" : "leyue.userdatas"
 }

删除索引

    db.collection.dropindex(index) 删除指定的索引。

    db.collection.dropindexes() 删除除了_id 以外的所有索引。

  • index 是字符串 表示按照索引名称 name 删除字段。
  • index 是{字段名称:1} 表示按照key 删除索引。

创建/查看/删除 示例

查看数据

  db.userdatas.find()
{ "_id" : objectid("597f357a09c84cf58880e412"), "name" : "u3", "age" : 32 }
{ "_id" : objectid("597f357a09c84cf58880e411"), "name" : "u4", "age" : 30, "score" : [ 7, 4, 2, 0 ] }
{ "_id" : objectid("597fcc0f411f2b2fd30d0b3f"), "age" : 20, "score" : [ 7, 4, 2, 0, 10, 9, 8, 7 ], "name" : "lihao" }
{ "_id" : objectid("597f357a09c84cf58880e413"), "name" : "u2", "age" : 33, "wendang" : { "yw" : 80, "xw" : 90 } }
{ "_id" : objectid("5983f5c88eec53fbcd56a7ca"), "date" : isodate("2017-08-04t04:19:20.693z") }
{ "_id" : objectid("597f357a09c84cf58880e40e"), "name" : "u1", "age" : 26, "address" : "中国砀山" }
{ "_id" : objectid("597f357a09c84cf58880e40f"), "name" : "u1", "age" : 37, "score" : [ 10, 203, 12, 43, 56, 22 ] }
{ "_id" : objectid("597f357a09c84cf58880e410"), "name" : "u5", "age" : 78, "address" : "china beijing chaoyang" }

给字段name 创建索引

 // 创建索引
 db.userdatas.createindex({"name":1})

 {
  "createdcollectionautomatically" : false,
  "numindexesbefore" : 1,
  "numindexesafter" : 2,
  "ok" : 1
 }


 // 查看索引
 db.userdatas.getindexes()

 [
  {
   "v" : 1,
   "key" : {
    "_id" : 1
   },
   "name" : "_id_",
   "ns" : "leyue.userdatas"
  },
  {
   "v" : 1,
   "key" : {
    "name" : 1
   },
   "name" : "name_1",
   "ns" : "leyue.userdatas"
  }
 ]

给字段name 创建索引并命名为myindex

 db.userdatas.createindex({"name":1})

 db.userdatas.createindex({"name":1},{"name":"myindex"})

 db.userdatas.getindexes()
 [
  {
   "v" : 1,
   "key" : {
    "_id" : 1
   },
   "name" : "_id_",
   "ns" : "leyue.userdatas"
  },
  {
   "v" : 1,
   "key" : {
    "name" : 1
   },
   "name" : "myindex",
   "ns" : "leyue.userdatas"
  }
 ]

给字段name 创建索引 创建的过程在后台执行

当mongodb 集合里面的数据过大时 创建索引很耗时,可以在放在后台运行。

 db.userdatas.dropindex("myindex")

 db.userdatas.createindex({"name":1},{"name":"myindex","background":true})

给age 字段创建唯一索引

 db.userdatas.createindex({"age":-1},{"name":"ageindex","unique":true,"sparse":true})

 db.userdatas.getindexes()

[
 {
  "v" : 1,
  "key" : {
   "_id" : 1
  },
  "name" : "_id_",
  "ns" : "leyue.userdatas"
 },
 {
  "v" : 1,
  "key" : {
   "name" : 1
  },
  "name" : "myindex",
  "ns" : "leyue.userdatas",
  "background" : true
 },
 {
  "v" : 1,
  "unique" : true,
  "key" : {
   "age" : -1
  },
  "name" : "ageindex",
  "ns" : "leyue.userdatas",
  "sparse" : true
 }
]

// 插入一个已存在的age
 db.userdatas.insert({ "name" : "u8", "age" : 32})


writeresult({
 "ninserted" : 0,
 "writeerror" : {
  "code" : 11000,
  "errmsg" : "e11000 duplicate key error index: leyue.userdatas.$ageindex dup key: { : 32.0 }"
 }
})

创建复合索引

 db.userdatas.createindex({"name":1,"age":-1})

 db.userdatas.getindexes()
[
 {
  "v" : 1,
  "key" : {
   "_id" : 1
  },
  "name" : "_id_",
  "ns" : "leyue.userdatas"
 },
 {
  "v" : 1,
  "key" : {
   "name" : 1,
   "age" : -1
  },
  "name" : "name_1_age_-1",
  "ns" : "leyue.userdatas"
 }
]

所有的字段都存在集合 system.indexes 中

db.system.indexes.find()
{ "v" : 1, "key" : { "_id" : 1 }, "name" : "_id_", "ns" : "leyue.userdatas" }
{ "v" : 1, "key" : { "_id" : 1 }, "name" : "_id_", "ns" : "leyue.scores" }
{ "v" : 1, "key" : { "_id" : 1 }, "name" : "_id_", "ns" : "leyue.test" }
{ "v" : 1, "key" : { "user" : 1, "name" : 1 }, "name" : "myindex", "ns" : "leyue.test" }
{ "v" : 1, "key" : { "_id" : 1 }, "name" : "_id_", "ns" : "leyue.mycapped" }
{ "v" : 1, "key" : { "user" : 1 }, "name" : "user_1", "ns" : "leyue.test" }
{ "v" : 1, "key" : { "name" : 1 }, "name" : "myindex", "ns" : "leyue.userdatas" }

索引总结

      1:创建索引时,1表示按升序存储,-1表示按降序存储。

      2:可以创建复合索引,如果想用到复合索引,必须在查询条件中包含复合索引中的前n个索引列

      3: 如果查询条件中的键值顺序和复合索引中的创建顺序不一致的话,

            mongodb可以智能的帮助我们调整该顺序,以便使复合索引可以为查询所用。

      4: 可以为内嵌文档创建索引,其规则和普通文档创建索引是一样的。

      5: 一次查询中只能使用一个索引,$or特殊,可以在每个分支条件上使用一个索引。

      6: $where,$exists不能使用索引,还有一些低效率的操作符,比如:$ne,$not,$nin等。

      7: 设计多个字段的索引时,应该尽量将用于精确匹配的字段放在索引的前面。

explain 使用

语法

 db.collection.explain().<method(...)>

explain() 可以设置参数 :

  • queryplanner。
  • executionstats。
  • allplansexecution。

示例

for(var i=0;i<100000;i++) {
 db.test.insert({"user":"user"+i});
}

没有使用索引

 db.test.explain("executionstats").find({"user":"user200000"})
{
 "queryplanner" : {
  "plannerversion" : 1,
  "namespace" : "leyue.test",
  "indexfilterset" : false,
  "parsedquery" : {
   "user" : {
    "$eq" : "user200000"
   }
  },
  "winningplan" : {
   "stage" : "collscan",
   "filter" : {
    "user" : {
     "$eq" : "user200000"
    }
   },
   "direction" : "forward"
  },
  "rejectedplans" : [ ]
 },
 "executionstats" : {
  "executionsuccess" : true,
  "nreturned" : 2,
  "executiontimemillis" : 326,
  "totalkeysexamined" : 0,
  "totaldocsexamined" : 1006497,
  "executionstages" : {
   "stage" : "collscan",
   "filter" : {
    "user" : {
     "$eq" : "user200000"
    }
   },
   "nreturned" : 2,
   "executiontimemillisestimate" : 270,
   "works" : 1006499,
   "advanced" : 2,
   "needtime" : 1006496,
   "needyield" : 0,
   "savestate" : 7863,
   "restorestate" : 7863,
   "iseof" : 1,
   "invalidates" : 0,
   "direction" : "forward",
   "docsexamined" : 1006497
  }
 },
 "serverinfo" : {
  "host" : "lihaodemacbook-pro.local",
  "port" : 27017,
  "version" : "3.2.1",
  "gitversion" : "a14d55980c2cdc565d4704a7e3ad37e4e535c1b2"
 },
 "ok" : 1
}
  • executionstats.executiontimemillis: query的整体查询时间。
  • executionstats.nreturned : 查询返回的条目。
  • executionstats.totalkeysexamined : 索引扫描条目。
  • executionstats.totaldocsexamined: 文档扫描条目。

executiontimemillis = 326 query 执行时间

nreturned=2 返回两条数据

totalkeysexamined=0 没有用到索引

totaldocsexamined 全文档扫描

理想状态:

nreturned=totalkeysexamined & totaldocsexamined=0

stage状态分析

stage 描述
collscan 全表扫描
ixscan 扫描索引
fetch 根据索引去检索指定document
shard_merge 将各个分片返回数据进行merge
sort 表明在内存中进行了排序
limit 使用limit限制返回数
skip 使用skip进行跳过
idhack 针对_id进行查询
sharding_filter 通过mongos对分片数据进行查询
count 利用db.coll.explain().count()之类进行count运算
countscan count不使用index进行count时的stage返回
count_scan count使用了index进行count时的stage返回
subpla 未使用到索引的$or查询的stage返回
text 使用全文索引进行查询时候的stage返回
projection 限定返回字段时候stage的返回

对于普通查询,我希望看到stage的组合(查询的时候尽可能用上索引):

       fetch+idhack

       fetch+ixscan

       limit+(fetch+ixscan)

       projection+ixscan

       sharding_fiter+ixscan

       count_scan

不希望看到包含如下的stage:

collscan(全表扫描),sort(使用sort但是无index),不合理的skip,subpla(未用到index的$or),countscan(不使用index进行count)

使用索引

  db.test.createindex({"user":1},{"name":"myindex","background":true})

  db.test.explain("executionstats").find({"user":"user200000"})
{
  "queryplanner" : {
    "plannerversion" : 1,
    "namespace" : "leyue.test",
    "indexfilterset" : false,
    "parsedquery" : {
      "user" : {
        "$eq" : "user200000"
      }
    },
    "winningplan" : {
      "stage" : "fetch",
      "inputstage" : {
        "stage" : "ixscan",
        "keypattern" : {
          "user" : 1
        },
        "indexname" : "myindex",
        "ismultikey" : false,
        "isunique" : false,
        "issparse" : false,
        "ispartial" : false,
        "indexversion" : 1,
        "direction" : "forward",
        "indexbounds" : {
          "user" : [
            "[\"user200000\", \"user200000\"]"
          ]
        }
      }
    },
    "rejectedplans" : [ ]
  },
  "executionstats" : {
    "executionsuccess" : true,
    "nreturned" : 2,
    "executiontimemillis" : 0,
    "totalkeysexamined" : 2,
    "totaldocsexamined" : 2,
    "executionstages" : {
      "stage" : "fetch",
      "nreturned" : 2,
      "executiontimemillisestimate" : 0,
      "works" : 3,
      "advanced" : 2,
      "needtime" : 0,
      "needyield" : 0,
      "savestate" : 0,
      "restorestate" : 0,
      "iseof" : 1,
      "invalidates" : 0,
      "docsexamined" : 2,
      "alreadyhasobj" : 0,
      "inputstage" : {
        "stage" : "ixscan",
        "nreturned" : 2,
        "executiontimemillisestimate" : 0,
        "works" : 3,
        "advanced" : 2,
        "needtime" : 0,
        "needyield" : 0,
        "savestate" : 0,
        "restorestate" : 0,
        "iseof" : 1,
        "invalidates" : 0,
        "keypattern" : {
          "user" : 1
        },
        "indexname" : "myindex",
        "ismultikey" : false,
        "isunique" : false,
        "issparse" : false,
        "ispartial" : false,
        "indexversion" : 1,
        "direction" : "forward",
        "indexbounds" : {
          "user" : [
            "[\"user200000\", \"user200000\"]"
          ]
        },
        "keysexamined" : 2,
        "dupstested" : 0,
        "dupsdropped" : 0,
        "seeninvalidated" : 0
      }
    }
  },
  "serverinfo" : {
    "host" : "lihaodemacbook-pro.local",
    "port" : 27017,
    "version" : "3.2.1",
    "gitversion" : "a14d55980c2cdc565d4704a7e3ad37e4e535c1b2"
  },
  "ok" : 1
}

executiontimemillis: 0

totalkeysexamined: 2

totaldocsexamined:2

nreturned:2

stage:ixscan

使用索引和不使用差距很大,合理使用索引,一个集合适合做 4-5 个索引。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对的支持。

相关文章