嗨,我有以下问题,一个保存用户联系信息的集合,它看起来像这样。
[{
"_id": {
"$oid": "5836b917885383034437d26b"
},
"Nombre": "Juan",
"Email": "[email protected]",
"Edad": 34,
"País": "España",
"Contactos": [
{
"Usuario_contacto": {
"_id": {
"$oid": "5836b916885383034437d23d"
},
"Nombre": "Alejandro",
"Email": "[email protected]",
"Edad": 32,
"País": "España",
"Tipo": "Usuario individual",
"Apellidos": "América Garzón",
"Teléfono": 639123123,
"Ciudad": "Salamanca",
"Identificador": "U-3491",
"Información_creación": {
"Fecha_creación": {
"Mes": 7,
"Día": 14,
"Año": 2016
},
"Hora_creación": {
"Hora": 5,
"Minutos": 22,
"Segundos": 16
}
}
},
"Fecha_alta": {
"Mes": 10,
"Día": 27,
"Año": 2016
},
"Hora_alta": {
"Hora": 23,
"Minutos": 2,
"Segundos": 31
}
},
{
"Usuario_contacto": {
"_id": {
"$oid": "5836b916885383034437d21f"
},
"Nombre": "Alfonso",
"Email": "[email protected]",
"Edad": 23,
"País": "España",
"Tipo": "Usuario individual",
"Apellidos": "Martínez Osorio",
"Teléfono": 612311456,
"Ciudad": "Bilbao",
"Identificador": "U-3461",
"Información_creación": {
"Fecha_creación": {
"Mes": 8,
"Día": 22,
"Año": 2016
},
"Hora_creación": {
"Hora": 7,
"Minutos": 22,
"Segundos": 30
}
}
},
"Fecha_alta": {
"Mes": 10,
"Día": 27,
"Año": 2016
},
"Hora_alta": {
"Hora": 12,
"Minutos": 7,
"Segundos": 48
}
},
{
"Usuario_contacto": {
"_id": {
"$oid": "5836b916885383034437d232"
},
"Nombre": "Mercedes",
"Email": "[email protected]",
"Edad": 50,
"País": "España",
"Tipo": "Usuario individual",
"Apellidos": "Rey Sordo",
"Teléfono": 635456989,
"Ciudad": "Castellón",
"Identificador": "U-3480",
"Información_creación": {
"Fecha_creación": {
"Mes": 4,
"Día": 28,
"Año": 2016
},
"Hora_creación": {
"Hora": 15,
"Minutos": 22,
"Segundos": 15
}
}
},
"Fecha_alta": {
"Mes": 10,
"Día": 24,
"Año": 2016
},
"Hora_alta": {
"Hora": 14,
"Minutos": 35,
"Segundos": 26
}
}
],
"Información_creación": {
"Fecha_creación": {
"Mes": 10,
"Día": 23,
"Año": 2016
},
"Hora_creación": {
"Hora": 10,
"Minutos": 12,
"Segundos": 10
}
},
"Apellidos": "Sanz Robles",
"Identifier": "U-3455",
"Tipo": "Usuario individual",
"Teléfono": 675456789,
"Ciudad": "Granada"
}
我被要求做的练习是为每个用户创建一个新的文档,有2个或更多的联系人在同一个城市("Ciudad")。
[...{
_id : { Identifier: ...
Ciudad: ... },
Counter: 3
}, ...
]
我是Mongo的新手,我尝试了很多,我知道我必须创建一个集合,但我不知道如何过滤这样的。
首先,我将使用一个简化的数据结构,因为我们只需要知道城市和文档id。
所以让我们插入一些记录。
db.test.insertMany([
{ "_id": 1, "contacts" : [
{ "name": "Name-1", "city" : "Manchester" },
{ "name": "Name-2", "city" : "Manchester" },
{ "name": "Name-3", "city" : "Manchester" }]
},
{ "_id": 2, "contacts" : [
{ "name": "Name-4", "city" : "York" },
{ "name": "Name-5", "city" : "Manchester" },
{ "name": "Name-6", "city" : "Sheffield" }]
},
{ "_id": 3, "contacts" : [
{ "name": "Name-7", "city" : "Sheffield" },
{ "name": "Name-8", "city" : "York" },
{ "name": "Name-9", "city" : "Sheffield" }]
}
])
然后我们需要一个aggragation流水线,它能将子文档的 contacts
将它们重新分组,这样我们就可以用一个 $sum
:
db.test.aggregate([
{ "$unwind": "$contacts" },
{ "$group": { "_id": { "_id": "$_id", "city": "$contacts.city" }, "count": { $sum: 1 } } }
]);
{ "_id" : { "_id" : 2, "city" : "Manchester" }, "count" : 1 }
{ "_id" : { "_id" : 2, "city" : "Sheffield" }, "count" : 1 }
{ "_id" : { "_id" : 3, "city" : "York" }, "count" : 1 }
{ "_id" : { "_id" : 1, "city" : "Manchester" }, "count" : 3 }
{ "_id" : { "_id" : 2, "city" : "York" }, "count" : 1 }
{ "_id" : { "_id" : 3, "city" : "Sheffield" }, "count" : 2 }
然后,我们需要过滤掉计数中小于2的,这可以通过$match阶段的grater than or equal to operator($gte
):
db.test.aggregate([
{ "$unwind": "$contacts" },
{ "$group": { "_id": { "_id": "$_id", "city": "$contacts.city" }, "count": { $sum: 1 } } },
{ "$match" : { "count" : { "$gte" : 2 } } }
]);
{ "_id" : { "_id" : 1, "city" : "Manchester" }, "count" : 3 }
{ "_id" : { "_id" : 3, "city" : "Sheffield" }, "count" : 2 }
这就得到了我们所需要的结果,所以现在只要把这些东西管到另一个集合里,就可以实现了 $out
阶段。
db.test.aggregate([
{ "$unwind": "$contacts" },
{ "$group": { "_id": { "_id": "$_id", "city": "$contacts.city" }, "count": { $sum: 1 } } },
{ "$match" : { "count" : { "$gte" : 2 } } },
{ "$out" : "test2" }
]);
这将会把所有的结果输出到一个叫作 test2
现在我们就可以直接查询了。
db.test2.find()
{ "_id" : { "_id" : 1, "city" : "Manchester" }, "count" : 3 }
{ "_id" : { "_id" : 3, "city" : "Sheffield" }, "count" : 2 }
这里有一些有用的链接,可以阅读更多关于聚合阶段的内容。