沪ICP备19023181号-1
Collect from网页模板
Modified by Sprite小站

MongoDB聚合操作

MongoDB聚合操作

简介

MongoDB是一款开源的NoSQL数据库,以其强大的查询和聚合功能而闻名。在MongoDB中,aggregate命令是一个非常强大的工具,用于对大量数据进行复杂的数据处理和转换。类似于sql中的group by

aggregate的工作原理

aggregate使用聚合管道来处理数据。聚合管道由一系列的阶段组成,每个阶段执行特定的操作,例如过滤、分组、排序和计算等。这些阶段按顺序执行,将数据从一个阶段传递到下一个阶段,直到最终产生聚合结果。

管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。

MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。

这里我们介绍一下聚合框架中常用的几个操作:

$project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。
$match:用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作。
$limit:用来限制MongoDB聚合管道返回的文档数。
$skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。
$unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
$group:将集合中的文档分组,可用于统计结果。
$sort:将输入文档排序后输出。
$geoNear:输出接近某一地理位置的有序文档。

如何使用aggregate

使用aggregate非常简单。首先,你需要连接到MongoDB数据库,然后使用聚合命令来执行你的聚合操作。
在示例中,我们首先使用$match阶段来筛选出create_date>"2024-01-01T17:08:18+08:00"类别的文档。
然后,我们使用$group阶段按client_order_ref进行分组,统计client_order_ref的数量 最后按client_order_ref的数量递减排序。

db.collection.aggregate([
  {
    $match: {
      create_date: {
        $gt: "2024-01-01T17:08:18+08:00",
      },
    },
  },
  {
    $group: {
      _id: "$client_order_ref",
      count: {
        $sum: 1,
      },
    },
  },
  {
    $sort: {
      count: -1,
    },
  },
])
字段 a 进行去重,但是对于重复的 a 字段,只希望统计一次相应的 b 字段的值
[
  {
    $match: {
      paid_at: {
        $gte: "2024-01-01 00:00:00",
        $lt: "2024-02-01 00:00:00",
      },
      store_name:
        "samarkand.kuaishou.foreveryoung",
      "order_status": {"$nin": ["TRADE_CLOSED", "TRADE_REFUND"]},
    },
  },
  {
    $group: {
      _id: "$client_order_ref",
      amounts: {
        $addToSet: "$pay_amount",
      },
    },
  },
  {
    $unwind: "$amounts",
  },
  {
    $group: {
      _id: null,
      total: {
        $sum: "$amounts",
      },
    },
  },
]

最佳实践

总结

aggregate是MongoDB中一个非常强大的工具,它可以帮助我们深入挖掘和分析大量数据。通过合理设计聚合管道和使用最佳实践,我们可以更好地利用aggregate的功能,从数据中提取出有价值的信息。


发表评论

评论列表,共 0 条评论

    暂无评论