MongoDB高级一点点的操做

时间 2019-11-21

原文原文链接

在MongoDB数据库中常见的聚合操做有：count，distinct，group，mapReduce。如今将它们一一的记录下来：数据库

1、count操做编程

这个操做顾名思义就是达到统计的效果啦，用来统计符合某一种查询条件的总数。
数组

/** 统计全部记录的总数 */
db.user.count()

/** 统计名字为 hanmeimei 的记录数 */
db.user.count({"name":"hanmeimei"})

2、distinct操做分布式

在SQL中这个单词的做用是去除重复的意思，在NoSQL数据库中也能够达到一样的效果。函数

/** 去除重复的年龄 */
db.person.distinct("age")

3、group操做oop

在关系型数据库中，group表示的是分租，在noSQL数据库中也是表示一样的意思，可是它的操做会比较麻烦一些。归根到底，group的操做就是造成了一种“k-v”模型。this

 /** 按照年龄 age 来进行分组 而后将name放在user里面 */
 
 > db.person.group({"key":{"age":true},"initial":{"user":[]},"$reduce":function(cur,prev){prev.user.push(cur.name);}})

key：这个就是分组的key，咱们这里是对年龄分组。spa

initial: 每组都分享一个”初始化函数“，特别注意：是每一组，好比这个的age=20的value的list分享一个initial函数，age=22一样也分享一个initial函数。code

$reduce: 这个函数的第一个参数是当前的文档对象，第二个参数是上一次function操做的累计对象，第一次为initial中的{”perosn“：[]}。有多少个文档， $reduce就会调用多少次。对象

 /** 按照年龄 age 来进行分组 同时要求年龄大于21岁，而且统计每一组查询出来的记录条数*/
 > db.person.group({"key":{"age":true},"initial":{"user":[]},"$reduce":function(cur,prev){prev.user.push(cur.name);},"finalize":function(out){out.count=out.user.length},"condition":{"age":{$gt:21}}})

condition: 这个就是过滤条件。

finalize:这是个函数，每一组文档执行完后，多会触发此方法，那么在每组集合里面加上count也就是它的活了。

4、mapReduce操做

mapReduce操做是MongoDB聚合操做中最复杂的操做，同时它也是最灵活。 mapReduce实际上是一种编程模型，用在分布式计算中，其中有一个“map”函数，一个”reduce“函数。mapReduce是hadoop的核心之一。

一、 map：

这个称为映射函数，里面会调用emit(key,value)，集合会按照你指定的key进行映射分组。

二、 reduce：

这个称为简化函数，会对map分组后的数据进行分组简化，注意：在reduce(key,value)中的key就是 emit中的key，vlaue为emit分组后的emit(value)的集合，这里也就是不少{"count":1}的数组。

三、 mapReduce:

这个就是最后执行的函数了，参数为map，reduce和一些可选参数

/** map 函数 */
var map=function(){ emit(this.name,{count:1})}

/** reduce 函数 */
 var reduce = function(key,value){var result = {count:0};for(var i = 0;i<value.length;i++){result.count += value[i].count;} return result}
 
/** mapReduce 操做 */
db.person.mapReduce(map,reduce,{"out":"collection"})

从图中咱们能够看到以下信息：

result: "存放的集合名“；

input:传入文档的个数。

emit：此函数被调用的次数。

reduce：此函数被调用的次数。

output:最后返回文档的个数。

同时咱们也能够看看最后根据name分组的结果：

这些都是MongoDB中经常使用的聚合操做了。