在 mongodb 的嵌套文档中搜索。

问题描述 投票:0回答:1

嗨,我有以下问题,一个保存用户联系信息的集合,它看起来像这样。

[{
  "_id": {
    "$oid": "5836b917885383034437d26b"
  },
  "Nombre": "Juan",
  "Email": "[email protected]",
  "Edad": 34,
  "País": "España",
  "Contactos": [
    {
      "Usuario_contacto": {
        "_id": {
          "$oid": "5836b916885383034437d23d"
        },
        "Nombre": "Alejandro",
        "Email": "[email protected]",
        "Edad": 32,
        "País": "España",
        "Tipo": "Usuario individual",
        "Apellidos": "América Garzón",
        "Teléfono": 639123123,
        "Ciudad": "Salamanca",
        "Identificador": "U-3491",
        "Información_creación": {
          "Fecha_creación": {
            "Mes": 7,
            "Día": 14,
            "Año": 2016
          },
          "Hora_creación": {
            "Hora": 5,
            "Minutos": 22,
            "Segundos": 16
          }
        }
      },
      "Fecha_alta": {
        "Mes": 10,
        "Día": 27,
        "Año": 2016
      },
      "Hora_alta": {
        "Hora": 23,
        "Minutos": 2,
        "Segundos": 31
      }
    },
    {
      "Usuario_contacto": {
        "_id": {
          "$oid": "5836b916885383034437d21f"
        },
        "Nombre": "Alfonso",
        "Email": "[email protected]",
        "Edad": 23,
        "País": "España",
        "Tipo": "Usuario individual",
        "Apellidos": "Martínez Osorio",
        "Teléfono": 612311456,
        "Ciudad": "Bilbao",
        "Identificador": "U-3461",
        "Información_creación": {
          "Fecha_creación": {
            "Mes": 8,
            "Día": 22,
            "Año": 2016
          },
          "Hora_creación": {
            "Hora": 7,
            "Minutos": 22,
            "Segundos": 30
          }
        }
      },
      "Fecha_alta": {
        "Mes": 10,
        "Día": 27,
        "Año": 2016
      },
      "Hora_alta": {
        "Hora": 12,
        "Minutos": 7,
        "Segundos": 48
      }
    },
    {
      "Usuario_contacto": {
        "_id": {
          "$oid": "5836b916885383034437d232"
        },
        "Nombre": "Mercedes",
        "Email": "[email protected]",
        "Edad": 50,
        "País": "España",
        "Tipo": "Usuario individual",
        "Apellidos": "Rey Sordo",
        "Teléfono": 635456989,
        "Ciudad": "Castellón",
        "Identificador": "U-3480",
        "Información_creación": {
          "Fecha_creación": {
            "Mes": 4,
            "Día": 28,
            "Año": 2016
          },
          "Hora_creación": {
            "Hora": 15,
            "Minutos": 22,
            "Segundos": 15
          }
        }
      },
      "Fecha_alta": {
        "Mes": 10,
        "Día": 24,
        "Año": 2016
      },
      "Hora_alta": {
        "Hora": 14,
        "Minutos": 35,
        "Segundos": 26
      }
    }
  ],
  "Información_creación": {
    "Fecha_creación": {
      "Mes": 10,
      "Día": 23,
      "Año": 2016
    },
    "Hora_creación": {
      "Hora": 10,
      "Minutos": 12,
      "Segundos": 10
    }
  },
  "Apellidos": "Sanz Robles",
  "Identifier": "U-3455",
  "Tipo": "Usuario individual",
  "Teléfono": 675456789,
  "Ciudad": "Granada"
}

我被要求做的练习是为每个用户创建一个新的文档,有2个或更多的联系人在同一个城市("Ciudad")。

[...{
      _id : { Identifier:    ...
                  Ciudad:   ... },
      Counter:  3 
}, ...
]

我是Mongo的新手,我尝试了很多,我知道我必须创建一个集合,但我不知道如何过滤这样的。

mongodb nested find aggregate
1个回答
0
投票

首先,我将使用一个简化的数据结构,因为我们只需要知道城市和文档id。

所以让我们插入一些记录。

db.test.insertMany([
   { "_id": 1, "contacts" : [
     { "name": "Name-1", "city" : "Manchester" },
     { "name": "Name-2", "city" : "Manchester" },
     { "name": "Name-3", "city" : "Manchester" }]
   },
   { "_id": 2, "contacts" : [
     { "name": "Name-4", "city" : "York" },
     { "name": "Name-5", "city" : "Manchester" },
     { "name": "Name-6", "city" : "Sheffield" }]
   },
   { "_id": 3, "contacts" : [
     { "name": "Name-7", "city" : "Sheffield" },
     { "name": "Name-8", "city" : "York" },
     { "name": "Name-9", "city" : "Sheffield" }]
   }
])

然后我们需要一个aggragation流水线,它能将子文档的 contacts 将它们重新分组,这样我们就可以用一个 $sum:

db.test.aggregate([
  { "$unwind": "$contacts" },
  { "$group": { "_id": { "_id": "$_id", "city": "$contacts.city" }, "count": { $sum: 1 } } }
]);

{ "_id" : { "_id" : 2, "city" : "Manchester" }, "count" : 1 }
{ "_id" : { "_id" : 2, "city" : "Sheffield" }, "count" : 1 }
{ "_id" : { "_id" : 3, "city" : "York" }, "count" : 1 }
{ "_id" : { "_id" : 1, "city" : "Manchester" }, "count" : 3 }
{ "_id" : { "_id" : 2, "city" : "York" }, "count" : 1 }
{ "_id" : { "_id" : 3, "city" : "Sheffield" }, "count" : 2 }

然后,我们需要过滤掉计数中小于2的,这可以通过$match阶段的grater than or equal to operator($gte):

db.test.aggregate([
  { "$unwind": "$contacts" },
  { "$group": { "_id": { "_id": "$_id", "city": "$contacts.city" }, "count": { $sum: 1 } } },
  { "$match" : { "count" : { "$gte" : 2 } } }
]);

{ "_id" : { "_id" : 1, "city" : "Manchester" }, "count" : 3 }
{ "_id" : { "_id" : 3, "city" : "Sheffield" }, "count" : 2 }

这就得到了我们所需要的结果,所以现在只要把这些东西管到另一个集合里,就可以实现了 $out 阶段。

db.test.aggregate([
  { "$unwind": "$contacts" },
  { "$group": { "_id": { "_id": "$_id", "city": "$contacts.city" }, "count": { $sum: 1 } } },
  { "$match" : { "count" : { "$gte" : 2 } } },
  { "$out" : "test2" }
]);

这将会把所有的结果输出到一个叫作 test2 现在我们就可以直接查询了。

db.test2.find()
{ "_id" : { "_id" : 1, "city" : "Manchester" }, "count" : 3 }
{ "_id" : { "_id" : 3, "city" : "Sheffield" }, "count" : 2 }

这里有一些有用的链接,可以阅读更多关于聚合阶段的内容。

© www.soinside.com 2019 - 2024. All rights reserved.