Mongodb получить отчет - PullRequest
       41

Mongodb получить отчет

22 голосов
/ 23 февраля 2011

Я использую mongoDB, в котором у меня есть коллекция следующего формата.

{"id" : 1 , name : x  ttm : 23 , val : 5 }
{"id" : 1 , name : x  ttm : 34 , val : 1 }
{"id" : 1 , name : x  ttm : 24 , val : 2 }
{"id" : 2 , name : x  ttm : 56 , val : 3 }
{"id" : 2 , name : x  ttm : 76 , val : 3 }
{"id" : 3 , name : x  ttm : 54 , val : 7 }

В этой коллекции я запросил, чтобы получить записи в порядке убывания, например:

db.foo.find({"id" : {"$in" : [1,2,3]}}).sort(ttm : -1).limit(3)

Но он дает две записи одного и того же id = 1, и я хочу, чтобы записи были такими, чтобы он давал 1 запись на id.

Возможно ли это в mongodb?

Ответы [ 5 ]

25 голосов
/ 23 февраля 2011

В mongodb есть команда distinct, которую можно использовать вместе с запросом. Тем не менее, я считаю, что это просто возвращает отдельный список значений для определенного ключа, который вы называете (т.е. в вашем случае вы получите только возвращенные значения идентификатора), поэтому я не уверен, что это даст вам именно то, что вы хотите, если вы нужны целые документы - вместо этого вам может потребоваться MapReduce.

Документация по отчетам: http://www.mongodb.org/display/DOCS/Aggregation#Aggregation-Distinct

15 голосов
/ 18 сентября 2015

Вы хотите использовать агрегацию. Вы можете сделать это так:

db.test.aggregate([
    // each Object is an aggregation.
    {
        $group: {
            originalId: {$first: '$_id'}, // Hold onto original ID.
            _id: '$id', // Set the unique identifier
            val:  {$first: '$val'},
            name: {$first: '$name'},
            ttm:  {$first: '$ttm'}
        }

    }, {
        // this receives the output from the first aggregation.
        // So the (originally) non-unique 'id' field is now
        // present as the _id field. We want to rename it.
        $project:{
            _id : '$originalId', // Restore original ID.

            id  : '$_id', // 
            val : '$val',
            name: '$name',
            ttm : '$ttm'
        }
    }
])

Это будет очень быстро ... ~ 90 мс для моей тестовой БД из 100 000 документов.

Пример:

db.test.find()
// { "_id" : ObjectId("55fb595b241fee91ac4cd881"), "id" : 1, "name" : "x", "ttm" : 23, "val" : 5 }
// { "_id" : ObjectId("55fb596d241fee91ac4cd882"), "id" : 1, "name" : "x", "ttm" : 34, "val" : 1 }
// { "_id" : ObjectId("55fb59c8241fee91ac4cd883"), "id" : 1, "name" : "x", "ttm" : 24, "val" : 2 }
// { "_id" : ObjectId("55fb59d9241fee91ac4cd884"), "id" : 2, "name" : "x", "ttm" : 56, "val" : 3 }
// { "_id" : ObjectId("55fb59e7241fee91ac4cd885"), "id" : 2, "name" : "x", "ttm" : 76, "val" : 3 }
// { "_id" : ObjectId("55fb59f9241fee91ac4cd886"), "id" : 3, "name" : "x", "ttm" : 54, "val" : 7 }


db.test.aggregate(/* from first code snippet */)

// output
{
    "result" : [
        {
            "_id" : ObjectId("55fb59f9241fee91ac4cd886"),
            "val" : 7,
            "name" : "x",
            "ttm" : 54,
            "id" : 3
        },
        {
            "_id" : ObjectId("55fb59d9241fee91ac4cd884"),
            "val" : 3,
            "name" : "x",
            "ttm" : 56,
            "id" : 2
        },
        {
            "_id" : ObjectId("55fb595b241fee91ac4cd881"),
            "val" : 5,
            "name" : "x",
            "ttm" : 23,
            "id" : 1
        }
    ],
    "ok" : 1
}

ПРОФИ: почти наверняка самый быстрый метод.

CONS: включает использование сложного API агрегации. Кроме того, он тесно связан с исходной схемой документа. Впрочем, это можно обобщить.

7 голосов
/ 01 июля 2014

Я полагаю, что вы можете использовать агрегат, как это

collection.aggregate({
   $group : {
        "_id" : "$id",
        "docs" : { 
            $first : { 
            "name" : "$name",
            "ttm" : "$ttm",
            "val" : "$val",
            }
        } 
    }
});
7 голосов
/ 13 декабря 2012

Проблема в том, что вы хотите перевести 3 совпадающих записи в одну, не предоставляя в запросе никакой логики для выбора между результатами сопоставления.

В основном вы можете указать какую-либо логику агрегирования (например, выбрать максимальное или минимальное значение для каждого столбца) или выполнить отдельный запрос и выбрать только те поля, которые вы хотите различить.

querymongo.com хорошо переводит эти отдельные запросы для вас (с SQL на MongoDB).

Например, этот SQL:

SELECT DISTINCT columnA FROM collection WHERE columnA > 5

Возвращается как этот MongoDB:

db.runCommand({
    "distinct": "collection",
    "query": {
        "columnA": {
            "$gt": 5
        }
    },
    "key": "columnA"
});
2 голосов
/ 16 апреля 2013

Если вы хотите записать отчетливый результат в файл, используя javascript ... это то, как вы делаете

cursor = db.myColl.find({'fieldName':'fieldValue'})

var Arr = new Array();
var count = 0;

cursor.forEach(

function(x) {

    var temp = x.id;    
var index = Arr.indexOf(temp);      
if(index==-1)
   {
     printjson(x.id);
     Arr[count] = temp;
         count++;
   }
})
...