欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

JAVA mongodb 聚合几种查询方式详解

程序员文章站 2023-11-17 16:35:40
一、basicdbobject 整个聚合查询是统计用户的各种状态下的用户数量为场景: 1.筛选条件: date为查询日期: basicdbobject qu...

一、basicdbobject

整个聚合查询是统计用户的各种状态下的用户数量为场景:

1.筛选条件:

date为查询日期:

basicdbobject query = new basicdbobject(); 
query.put("time",new basicdbobject("$gte", date + " 00:00:00")
 .append("$lte", date + " 23:59:59"));

如果有多个条件:直接加query.put("status", 0);

如果有or筛选:

basicdblist values = new basicdblist();
values.add(new basicdbobject("status", new basicdbobject("$exists",false)));
values.add(new basicdbobject("status", 0));
query.put("$or", values);

其中 new basicdbobject("$exists",false)) 就是“status”不存在(mongodb文档可不等于实体的字段)

2.拼接match

dbobject match = new basicdbobject("$match", query);

将上一步的query放入macth筛选中

3.拼接分组条件

此步相当于sql的group by

basicdbobject groupby = new basicdbobject();// 分组条件
groupby.put("userid", "$userid");//根据用户id来分组

同第一步的筛选一样,如果有多个分组可直接添加在后面:groupby.put("status", "$status");

4.分组后查询

首先把分组拼接上:

dbobject select = new basicdbobject("_id", groupby);

如果我们要对分组后的数据进行操作:(这里是用户的统计数量)

select.put("count", new basicdbobject("$sum", 1));

5.拼接$group

dbobject group = new basicdbobject("$group", select);

至此。我们拼接,mongodb的语句到此结束

下面我们开始查询操作:

import com.mongodb.aggregationoutput;
import org.springframework.data.mongodb.core.mongotemplate;
aggregationoutput output = mongotemplate.getcollection("这里是mongodb的数据表名")
  .aggregate(match, group);

读取查询结果:

iterable<dbobject> map = output.results();
//遍历map
for (dbobject dbobject : map) {
  //这里读取到的map为{"_id":{"userid":1,"status"0}}...   
  map<string, object> resultmap = (map<string, object>) dbobject.get("_id");

  //这里截取掉.0   
  integer userid = integer.parseint(commutil.tostring(ausgmap.get("userid")).replace(".0",""));

  //在这里我们就可以对我们的数据进行操作了;  
  integer count = integer.parseint(commutil.tostring(dbobject.get("count")));
     
}

二、dbobject

不多说,如果大家觉得第一种方法特别长篇大论,那么下面我给大家带来一种代码更简洁的聚合查询:

直接上代码吧。

1.注意导入的包:

import com.mongodb.dbobject; import com.mongodb.util.json;

2.$macth:

(beginday-查询开始日期;endday-查询结束日期)

dbobject match = (dbobject) json.parse("{$match:{'status':'1','time':
  {$gte:'"+beginday+"',$lte:'"+endday+"'}}}");

3.$group:

(以userid分组,统计用户数量,累加amout字段值,取amout字段最大值)

dbobject group = (dbobject) json.parse("{$group:{_id:'$userid', 
  count:{$sum:1},total:{$sum:'$amount'},maxsigle:{$max:'$amount'}}}");

条件拼接完,开始查询:

list<dbobject> list = new arraylist<dbobject>();
list.add(match); list.add(group);
aggregationoutput output = mongotemplate.getcollection("表名").aggregate(list);

遍历结果就不用在说了。上面已经详细描述了

第二种方法是不是比一种方式简单多了。但是比较考验自身对mongodb语句熟悉性。

【扩展】

接着上面的方法进行扩展

//status 为0或者为1 ; type 不为11;time在beginday ~ endday时间段内
dbobject match = (dbobject) json.parse("{$match:{'status':{$in:['0','1']},
  type:{$ne:11},'time':{$gte:'"+beginday+"',$lte:'"+endday+"'}}}");

//以用户id分组,统计查询次数,取最后一次time的时间
dbobject group = (dbobject) json.parse("{$group:{_id:'$userid', 
  count:{$sum:1},lasttime:{$max:'$time'} }}");

//在上一步统计出的结果中筛选次数大于100的数据
dbobject groupmatch = (dbobject) json.parse("{$match:{count:{$gte:100}}}");

//$project----查询结果中需要显示哪些字段,显示则设置为1。如下需要不显示_id 域(字段),则需如下指定:
//db.集合名.aggregate( [ { $project : { _id: 0, count: 1 , lastsucctime: 1 } } ] )
dbobject project = (dbobject) json.parse("{$project:{_id:1,count:1,lastsucctime:1}}");

dbobject sort = (dbobject) json.parse("{$sort:{'count':-1}}");//排序

list<dbobject> list = new arraylist<dbobject>();
list.add(match);
list.add(group);
list.add(groupmatch);
list.add(project);
list.add(sort);
aggregationoutput catchoutput = mongotemplate.getcollection("表名")
  .aggregate(list);//查询结果

三、basicdbobject+脚本语句

basicdbobject groupindex = new basicdbobject();
basicdbobject distinctquery = new basicdbobject();
distinctquery.put("userid", new basicdbobject("$in", userids));//userids数组
basicdbobject initindex = new basicdbobject();
initindex.put("count", 0);//给count赋初值

// 脚本(doc代表数据库的数据.prev代表查询结果//prev.count这里的count就是上一步initindex的count)
string reduce = "function(doc, prev) {if(doc.status==0){prev.count+= 1;};}";
list<map<string, object>> basicdblist = (list<map<string, object>>) mongotemplate.
  getcollection("collection").group(groupindex, distinctquery, initindex, reduce, null);

最后循环遍历list即可得到结果【ps:group这种聚合方式有个限制条件--->超过20000数据就会报错】

以上就是我在普通业务处理中用到mongodb聚合处理。如果有更好的方法或是有需要改进的地方,欢迎大家给我留言~