MongoDB 中聚合统计计算--$SUM表达式
程序员文章站
2022-12-22 14:11:52
我们一般通过表达式$sum来计算总和。因为MongoDB的文档有数组字段,所以可以简单的将计算总和分成两种:1,统计符合条件的所有文档的某个字段的总和;2,统计每个文档的数组字段里面的各个数据值的和。这两种情况都可以通过$sum表达式来完成。以上两种情况的聚合统计,分别对应与聚合框架中的 $grou ......
我们一般通过表达式$sum来计算总和。因为mongodb的文档有数组字段,所以可以简单的将计算总和分成两种:
1,统计符合条件的所有文档的某个字段的总和;
2,统计每个文档的数组字段里面的各个数据值的和。这两种情况都可以通过$sum表达式来完成。
以上两种情况的聚合统计,分别对应与聚合框架中的 $group
操作步骤和 $project
操作步骤。
1.$group
直接看例子吧。
case 1
测试集合mycol中的数据如下:
{ title: 'mongodb overview', description: 'mongodb is no sql database', by_user: 'runoob.com', url: 'http://www.runoob.com', tags: ['mongodb', 'database', 'nosql'], likes: 100 }, { title: 'nosql overview', description: 'no sql database is very fast', by_user: 'runoob.com', url: 'http://www.runoob.com', tags: ['mongodb', 'database', 'nosql'], likes: 10 }, { title: 'neo4j overview', description: 'neo4j is no sql database', by_user: 'neo4j', url: 'http://www.neo4j.com', tags: ['neo4j', 'database', 'nosql'], likes: 750 }
现在我们通过以上集合计算每个作者所写的文章数,使用aggregate()计算
db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])
查询结果如下:
/* 1 */ { "_id" : "neo4j", "num_tutorial" : 1 }, /* 2 */ { "_id" : "runoob.com", "num_tutorial" : 2 }
case 2
统计每个作者被like的总和,计算表达式:
db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
查询结果如下;
/* 1 */ { "_id" : "neo4j", "num_tutorial" : 750 }, /* 2 */ { "_id" : "runoob.com", "num_tutorial" : 110 }
case 3
上面例子有些简单,我们再丰富一下,测试集合sales的数据如下:
{ "_id" : 1, "item" : "abc", "price" : 10, "quantity" : 2, "date" : isodate("2014-01-01t08:00:00z") } { "_id" : 2, "item" : "jkl", "price" : 20, "quantity" : 1, "date" : isodate("2014-02-03t09:00:00z") } { "_id" : 3, "item" : "xyz", "price" : 5, "quantity" : 5, "date" : isodate("2014-02-03t09:05:00z") } { "_id" : 4, "item" : "abc", "price" : 10, "quantity" : 10, "date" : isodate("2014-02-15t08:00:00z") } { "_id" : 5, "item" : "xyz", "price" : 5, "quantity" : 10, "date" : isodate("2014-02-15t09:05:00z") }
需要完成的目标是,基于日期分组,统计每天的销售额,聚合公式为:
db.sales.aggregate( [ { $group: { _id: { day: { $dayofyear: "$date"}, year: { $year: "$date" } }, totalamount: { $sum: { $multiply: [ "$price", "$quantity" ] } }, count: { $sum: 1 } } } ] )
查询结果是:
{ "_id" : { "day" : 46, "year" : 2014 }, "totalamount" : 150, "count" : 2 } { "_id" : { "day" : 34, "year" : 2014 }, "totalamount" : 45, "count" : 2 } { "_id" : { "day" : 1, "year" : 2014 }, "totalamount" : 20, "count" : 1 }
2.$project阶段
case 4
假设存在一个 students 集合,其数据结构如下:
{ "_id": 1, "quizzes": [ 10, 6, 7 ], "labs": [ 5, 8 ], "final": 80, "midterm": 75 } { "_id": 2, "quizzes": [ 9, 10 ], "labs": [ 8, 8 ], "final": 95, "midterm": 80 } { "_id": 3, "quizzes": [ 4, 5, 5 ], "labs": [ 6, 5 ], "final": 78, "midterm": 70 }
现在的需求是统计每个学生的 平常的测验分数总和、实验分数总和、期末其中分数总和。
db.students.aggregate([ { $project: { quiztotal: { $sum: "$quizzes"}, labtotal: { $sum: "$labs" }, examtotal: { $sum: [ "$final", "$midterm" ] } } } ])
其查询输出结果如下:
{ "_id" : 1, "quiztotal" : 23, "labtotal" : 13, "examtotal" : 155 } { "_id" : 2, "quiztotal" : 19, "labtotal" : 16, "examtotal" : 175 } { "_id" : 3, "quiztotal" : 14, "labtotal" : 11, "examtotal" : 148 }
参考文献:
总结
以上所述是小编给大家介绍的mongodb 中聚合统计计算--$sum表达式,希望对大家有所帮助
上一篇: 第一部分day5 文件操作
下一篇: 数据分析 之 NumPy