MongoDB: _id не может быть массивом - PullRequest
0 голосов
/ 23 ноября 2011

У меня большой набор данных (около 1,1 млн. Документов), для которого мне нужно запустить mapreduce.

Поле для группировки - это массив с именем xref. Из-за размера коллекции и того факта, что я делаю это в 32-битной среде, я пытаюсь уменьшить коллекцию до другой коллекции в новой базе данных.

Во-первых, вот пример данных:

{ "_id" : ObjectId("4ec6d3aa61910ad451f12e01"), 
"bii" : -32.9867, 
"class" : 2456, 
"decdeg" : -82.4856, 
"lii" : 297.4896,
"name" : "HD 22237", 
"radeg" : 50.3284,
"vmag" : 8, 
"xref" : ["HD 22237", "CPD -82   65", "-82   64","PPM 376283", "SAO 258336",
          "CP-82   65","GC 4125" ] }

{ "_id" : ObjectId("4ec6d44661910ad451f78eba"), 
  "bii" : -32.9901, 
  "class" : 2450, 
  "decdeg" : -82.4781, 
  "decpm" : 0.013,
  "lii" : 297.4807, 
  "name" : "PPM 376283", 
  "radeg" : 50.3543, 
  "rapm" : 0.0357, 
  "vmag" : 8.4, 
  "xref" : ["HD 22237", "CPD -82   65", "-82   64","PPM 376283", "SAO 258336",
          "CP-82   65","GC 4125" ] }

{ "_id" : ObjectId("4ec6d48a61910ad451feae04"), 
  "bii" : -32.9903, 
  "class" : 2450, 
  "decdeg" : -82.4779, 
  "decpm" : 0.027,
  "hd_component" : 0, 
  "lii" : 297.4806, 
  "name" : "SAO 258336", 
  "radeg" : 50.3543, 
  "rapm" : 0.0355, 
  "vmag" : 8, 
"xref" : ["HD 22237", "CPD -82   65", "-82   64","PPM 376283", "SAO 258336",
          "CP-82   65","GC 4125" ] }

Вот карта и функции сокращения (сейчас я только поля lii и bii):

function map() {
try {
    emit(this.xref, {lii:this.lii, bii:this.bii});
} catch(e) {
}
}

function reduce(key, values) {

var result = {xref:key, lii: 0.0, bii: 0.0};
try {
    values.forEach(function(value) {

        if (value.lii && value.bii) {
            result.lii += value.lii;
            result.bii += value.bii;
        }
    });

    result.bii /= values.length;
    result.lii /= values.length;
} catch(e) {
}

return result;
}

К сожалению, выполнение этого в конечном итоге приводит к сообщению об ошибке:

db.catalog.mapReduce(map, reduce, {out:{replace:"catalog2", db:"astro2"}});

Wed Nov 23 10:12:25 uncaught exception: map reduce failed:{
    "assertion" : "_id cannot be an array",
    "assertionCode" : 10099,
    "errmsg" : "db assertion failure",
    "ok" : 0

Поле внешней ссылки - это массив, но все значения в этом массиве равны. Он пытается использовать этот массив в качестве поля id в новых коллекциях?

1 Ответ

5 голосов
/ 24 ноября 2011

Да, невозможно установить _id как массив, потому что он имеет специальное поведение для индексации.Ключ, которым вы излучаете, используется как _id в выходной коллекции.Потенциально это может работать только с «встроенным» режимом вывода, если результат невелик, поскольку он не попадет в коллекцию.Но в идеале вы должны преобразовать массив в строку (например, в конкататуре значений) и использовать его как _id, или сделать его подобъектом вместо массива.

Также обратите внимание, что результат вашей функции Reduceне должен включать ключ.Просто верните {lii: .., bii: ..}

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...