$group

语法

  1. { $group: { _id"$分组字段名", 显示字段名: { 聚集函数: "$字段名"},[显示字段名2: { 聚集函数: "$字段名"}, ...] } }

说明

$group实现对结果集的分组,类似SQL中的group by语句。

首先指定分组键(_id) ,通过“_id”来标识分组字段,分组字段可以是单个,也可以是多个,格式如下:

单个分组键:

  1. { _id: "$field" }

多个分组键:

  1. { _id: { field1: "$field1", field2: "$field2", ... } }

示例

$group使用如下:

  1. > db.sample.employee.aggregate({ $group: { _id: "$major", avg_score: { $avg: "$score" }, Major: { $first: "$major" } } })
  2. {
  3. "avg_score": 82,
  4. "Major": "光学"
  5. }
  6. {
  7. "avg_score": 77.25,
  8. "Major": "物理学"
  9. }

该操作表示从集合 sample.employee 中读取记录,并按major字段进行分组。在返回的结果集中,取各分组的第一条记录的major字段,重命名为Major;对各分组中的score字段值求平均值,重命名为avg_score。返回如下所示:

$group支持的聚集函数

函数名描述
$addtoset将字段添加到数组中,相同的字段值只会添加一次
$first取分组中第一条记录中的字段值
$last取分组中最后一条记录中的字段值
$max取分组中字段值最大的
$min取分组中字段值最小的
$avg取分组中字段值的平均值
$push将所有字段添加到数组中,即使数组中已经存在相同的字段值,也继续添加
$sum取分组中字段值的总和
$count对记录分组后,返回表所有的记录条数

$addtoset

记录分组后,使用$addtoset 将指定字段值添加到数组中,相同的字段值只会添加一次。对嵌套对象使用点操作符(.)引用字段名。

示例

如下操作对记录分组后将指定字段值添加到数组中输出:

  1. > db.sample.employee.aggregate({ $group: { _id: "$dep", Dep: { $first: "$dep" }, addtoset_major: { $addtoset: "$major" } } })
  2. {
  3. "Dep": "物电学院",
  4. "addtoset_major": [
  5. "物理学",
  6. "光学",
  7. "电学"
  8. ]
  9. }
  10. {
  11. "Dep": "计算机学院",
  12. "addtoset_major": [
  13. "计算机科学与技术",
  14. "计算机软件与理论",
  15. "计算机工程"
  16. ]
  17. }

此操作对记录按dep字段值进行分组,并使用$first输出每个组第一条记录的dep字段,输出字段名为Dep;又将 major字段的值使用$addtoset 放入数组中返回,输出字段名为addtoset_major,如下:

$count

记录分组后,用$count 取出分组所包含的总记录条数。

示例

对记录分组后,返回表所有的记录条数:

  1. > db.sample.employee.aggregate({ $group: { Total: { $count: "$dep" } } })
  2. {
  3. "Total": 1001
  4. }

$first

记录分组后,取分组中第一条记录指定的字段值,对嵌套对象使用点操作符(.)引用字段名。

示例

对记录分组后,输出每个分组第一条记录的指定字段值:

  1. > db.sample.employee.aggregate({ $group: { _id: "$dep", Dep: { $first: "$dep" }, Name: { $first: "$info.name" } } })
  2. {
  3. "Dep": "物电学院",
  4. "Name": "Lily"
  5. }
  6. {
  7. "Dep": "计算机学院",
  8. "Name": "Tom"
  9. }

此操作对记录按dep字段分组,取每个分组中第一条记录的dep字段值和嵌套对象name字段值,输出字段名分别为 Dep 和 Name。

$avg

记录分组后,取分组中指定字段的平均值返回,对嵌套对象使用点操作符(.)引用字段名。

示例

对记录分组后,返回分组中指定字段的平均值:

  1. > db.sample.employee.aggregate({ $group: { _id: "$dep", avg_age: { $avg: "$info.age" }, max_age: { $max: "$info.age" }, min_age: { $min: "$info.age" } } })
  2. {
  3. "avg_age": 23.727273,
  4. "max_age": 36,
  5. "min_age": 15
  6. }
  7. {
  8. "avg_age": 24.5,
  9. "max_age": 30,
  10. "min_age": 20
  11. }

此操作对记录按dep字段分组,使用$avg返回每个分组中的嵌套对象age字段的平均值,输出字段名为avg_age;又使用$min返回每个分组中嵌套对象age字段的最小值,输出字段名为min_age,使用$max 返回每个分组中嵌套对象 age字段的最大值,输出字段名为max_age。

$max

记录分组后,取分组中指定字段的最大值返回,对嵌套对象使用点操作符(.)引用字段名。

示例

对记录分组后,返回分组中指定字段的最大值:

  1. > db.sample.employee.aggregate({ $group: { _id: "$dep", max_score: { $max:"$score" }, Name: { $last: "$info.name" } } })
  2. {
  3. "max_score": 93,
  4. "Name": "Kate"
  5. }
  6. {
  7. "max_score": 90,
  8. "Name": "Jim"
  9. }

此操作对记录按dep字段分组,使用$max 返回每个分组中score 字段的最大值,输出字段名为max_score,又使用 $last取每个分组中最后一条记录嵌套对象name字段值,输出字段名为Name。

$min

记录分组后,取分组中指定字段的最小值返回,对嵌套对象使用点操作符(.)引用字段名。

示例

对记录分组后,返回分组中指定字段的最小值:

  1. > db.sample.employee.aggregate({ $group: { _id: "$dep", min_score: { $min: "$score" }, Name: { $last: "$info.name" } } })
  2. {
  3. "min_score": 72,
  4. "Name": "Kate"
  5. }
  6. {
  7. "min_score": 69,
  8. "Name": "Jim"
  9. }

此操作对记录按dep字段分组,使用$min 返回每个分组中score字段的最小值,输出字段名为min_score,又使用 $last取每个分组中最后一条记录嵌套对象name字段值,输出字段名为Name。

$last

记录分组后,取分组中最后一条记录指定的字段值,对嵌套对象使用点操作符(.)引用字段名。

示例

对记录分组后,输出每个分组最后一条记录的指定字段值:

  1. > db.sample.employee.aggregate({ $group: { _id: "$dep", Major: { $addtoset: "$major" }, Name: { $last: "$info.name" } } })
  2. {
  3. "Major": [
  4. "物理学",
  5. "光学",
  6. "电学"
  7. ],
  8. "Name": "Kate"
  9. }
  10. {
  11. "Major": [
  12. "计算机科学与技术",
  13. "计算机软件与理论",
  14. "计算机工程"
  15. ],
  16. "Name": "Jim"
  17. }

此操作对记录按dep字段分组,使用$last取每个分组中最后一条记录嵌套对象name字段值,输出字段名为Name,并且将每个分组中的major字段值使用$addtoset填充到数组中返回,返回字段名为Major。

$push

记录分组后,使用$push将指定字段值添加到数组中,即使数组中已经存在相同的值,也继续添加。对嵌套对象使用点操作符(.)引用字段名。

示例

如下操作对记录分组后将指定字段值添加到数组中输出:

  1. > db.sample.employee.aggregate({ $group: { _id: "$dep", Dep: { $first: "$dep" }, push_age: { $push: "$info.age" } } })
  2. {
  3. "Dep": "物电学院",
  4. "push_age": [
  5. 28,
  6. 18,
  7. 20,
  8. 30,
  9. 28,
  10. 20
  11. ]
  12. }
  13. {
  14. "Dep": "计算机学院",
  15. "push_age": [
  16. 25,
  17. 20,
  18. 22
  19. ]
  20. }

此操作对记录按dep字段值进行分组,每个分组中嵌套对象age字段的值使用$push放入数组中返回,输出字段名为 push_age,如下:

$sum

记录分组后,返回每个分组中指定字段值的总和,对嵌套对象使用点操作符(.)引用字段名。

示例

对记录分组后,返回分组中指定字段值的总和:

  1. > db.sample.employee.aggregate({ $group: { _id: "$dep", sum_score: { $sum: "$score" }, Dep: { $first: "$dep" } } })
  2. {
  3. "sum_score": 888,
  4. "Dep": "物电学院"
  5. }
  6. {
  7. "sum_score": 476,
  8. "Dep": "计算机学院"
  9. }

此操作对记录按dep字段分组,使用$sum返回每个分组中score字段值的总和,输出字段名为sum_score;又使用$first取每个分组中第一条记录的dep字段值,输出字段名为Dep。