欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

MongoDB 优化

程序员文章站 2022-05-25 10:58:04
...


优化一个简单的例子

这部分主要讲解如何优化MongoDB的性能。

让我们举个具体示例。假使我们的任务是现实blog的首页-我们希望现实最近发布的10条posts。ts为时间字段。

语句如下

articles = db.posts.find().sort({ts:-1}); 
// get blog posts in reverse time order
for (var i=0; i< 10; i++) 
{   print(articles[i].getSummary());}
优化 #1: 创建索引

第一个优化就是要在ts上创建索引,用来快速排序。

db.posts.ensureIndex({ts:1});

使用索引,数据库就可以基于索引信息排序,不会直接查看每个document。这样做更快。

优化#2: 限定结果

MongoDB游标返回一组document,我们叫这个为chunks。

这chunk可能包含超过10个对象。额外的对象对于我们的需求是浪费,

浪费了网络带宽和应用服务器以及数据库的资源。

我们知道想要结果的个数,那么就不需要所有的结果。我们可以使用limit()方法

articles = db.posts.find().sort({ts:-1}).limit(10); 
// 最多10条

现在,我们从客户端返回了10条。

优化 #3: 查询相关的字段

post对象非常大, 如post文本和评论数组。 比较好的方式是只查询我们要用到的字段。

articles = db.posts.find({}, {ts:1,title:1,author:1,abstract:1}).sort({ts:-1}).limit(10);
articles.forEach( function(post) { print(post.getSummary()); } );

上面的getSummary()方法假使是可以获得find()方法返回的字段值

注意,如果你选择了要查询的字段,那么返回的就是部分对象。这个对象并不能直接进行更新。如下

a_post = db.posts.findOne({}, Post.summaryFields);
a_post.x = 3;
db.posts.save(a_post); // 错误,抛出异常

使用 Profiler

MongoDB有一个数据库的 profiler,用来显示每个操作的性能。

使用profiler你可以查看到哪些查询或者写入的速度比较慢。

举个例子,使用这些信息可以知道什么时候需要索引。详情查看 Database Profiler 。

 Use count()优化语句

加速语句速度依赖于count(),创建一个索引,调用count()。

db.posts.ensureIndex({author:1});
db.posts.find({author:"george"}).count();

增量操作Increment Operations

MongoDB 支持简单对象字段的增量操作; 

基本上来说, 这个操作就是 在服务器document中增量一个字段"。

这个要比"获取一个document,更新这个字段并且在保存会服务器"这个方法快很多,

并且对于实时的计数器更为有用。详情请看  Updates 。

固定大小的collection。

MongoDB提供了一个特殊的collection,它提前分配好了存储空间。

保存的项都是固定顺序的,并且没有索引。而且写入和读取是非常高速的。

存储是为了保存日志文件所设置的。详情查看 Capped Collections 

服务端代码执行Server Side Code Execution

也许有的时候为了高性能,避免客户端和服务端来回通信,需要直接在服务端执行代码。

这部分查看 Server-Side Processing 。

Explain工具

要想查看查询语句的详细性能信息,最好的方法就是使用explain方法。

返回的结果就是整个查询执行的一些信息。

当使用shell的时候,可以调用cursor的explain() 方法。

db.collection.find(query).explain();

返回的信息如下

{"cursor" : "BasicCursor",    
"indexBounds" : [ ],    
"nscanned" : 57594,    
"nscannedObjects" : 57594,    
"nYields" : 2 ,    
"n" : 3 ,    
"millis" : 108,    
"indexOnly" : false}
现实结果可以得知cursor的类型,DB扫描的数据数,返回的数据数,还有执行的毫秒数。

  • nscanned - 扫描的数据条数。这个数据可能是对象也可能是索引的键。
  • 如果"覆盖索引(covered index)"被调用了,nscanned 要高于nscannedObjects.
  • nscannedObjects - 扫描对象的数。
  • nYields - 查询所产生的锁的个数。
  • indexOnly - 是否使用了covered index。

Hint

虽然MongoDB查询优化器一般工作的很不错,但是也可以使用hints来强迫MongoDB使用一个指定的索引。

这种方法某些情形下会提升性能。 一个有索引的collection并且执行一个多字段的查询(一些字段已经索引了)。

传入一个指定的索引,强迫查询进行使用。

 

db.collection.find({user:u, foo:d}).hint({user:1});
确定创建了索引。
上面的例子,首先你确定索引已经创建了。请使用ensureIndex()创建索引。

其他的例子,有个在 {a:1, b:1} 上的索引,名称为"a_1_b_1":

db.collection.find({a:4,b:5,c:6}).hint({a:1,b:1});
db.collection.find({a:4,b:5,c:6}).hint("a_1_b_1");

强迫查询不适用索引, (做一个表的扫描), 使用:

> db.collection.find().hint({$natural:1})