Как сделать вывод агрегации фасетов в истинный ключ: значение json? - PullRequest
0 голосов
/ 02 февраля 2019

Я написал скрипт для агрегирования некоторых данных, но вывод не в истинном json.

Я попытался изменить часть $project конвейера агрегации, но я не думаю, что я делаю это правильно.

    pipeline = [
        {
            "$match": {
                "manu": {"$ne": "randomized"},
            }},
        {
            "$match": {
                "rssi": {"$lt": "-65db"}
            }
        },
        {"$sort": {"time": -1}},
        {
            "$group": {"_id": "$mac",
                       "lastSeen": {"$first": "$time"},
                       "firstSeen": {"$last": "$time"},
                       }
        },

        {
            "$project":
            {
                "_id": 1,
                "lastSeen": 1,
                "firstSeen": 1,
                "minutes":
                {
                    "$trunc":
                    {
                        "$divide": [{"$subtract": ["$lastSeen", "$firstSeen"]}, 60000]
                    }
                },

            }
        },

        {
            "$facet": {
                "0-5": [
                    {"$match": {"minutes": {"$gte": 1, "$lte": 5}}},
                    {"$count": "0-5"},
                ],
                "5-10": [
                    {"$match": {"minutes": {"$gte": 5, "$lte": 10}}},
                    {"$count": "5-10"},
                ],
                "10-20": [
                    {"$match": {"minutes": {"$gte": 10, "$lte": 20}}},
                    {"$count": "10-20"},
                ],
            }
        },
        {"$project": {
            "0-5": {"$arrayElemAt": ["$0-5.0-5", 0]},
            "5-10": {"$arrayElemAt": ["$5-10.5-10", 0]},
            "10-20": {"$arrayElemAt": ["$10-20.10-20", 0]},

        }},

        {"$sort": SON([("_id", -1)])}

    ]

    data = list(collection.aggregate(pipeline, allowDiskUse=True))

Так что я в основном получаю вывод как {'0-5': 2914, '5-10': 1384, '10-20': 1295} - который нельзя использовать для итерации.

В идеале это должно быть что-то вроде

{'timeframe': '0-5', 'count': 262}

Есть предложения?

Заранее спасибо.

1 Ответ

0 голосов
/ 02 февраля 2019

Вы можете попробовать агрегацию ниже (заменив текущие $facet и ниже стадии):

db.col.aggregate([{
    "$facet": {
            "0-5": [
                {"$match": {"minutes": {"$gte": 1, "$lte": 5}}},
                {"$count": "total"},
            ],
            "5-10": [
                {"$match": {"minutes": {"$gte": 5, "$lte": 10}}},
                {"$count": "total"},
            ],
            "10-20": [
                {"$match": {"minutes": {"$gte": 10, "$lte": 20}}},
                {"$count": "total"},
            ]
        },
    },
    {
        $project: {
            result: { $objectToArray: "$$ROOT" }
        }
    },
    {
        $unwind: "$result"
    },
    {
        $unwind: "$result.v"
    },
    {
        $project: {
            timeframe: "$result.k",
            count: "$result.v.total"
        }
    }
])

$ facet возвращает один документ, который содержит три поля (результаты субагрегации).Вы можете использовать $ objectToArray , чтобы получить его в форме полей k и v, а затем использовать $ unwind для получения одного документа на ключ.

...