Я рассматриваю MongoDB прямо сейчас.Именно поэтому цель ясна: вот что должно произойти: в моем...
У меня есть вопрос о Ruby: Учитывая входную строку, мне нужно вернуть хеш, ключи которого - слова в...
Я выполняю задание ETL с Hadoop, где мне нужно вывести действительные преобразованные данные в...
Я пытаюсь использовать MultipleOutputs в Reducer, чтобы записывать в несколько файлов, используя...
Вот что я делаю: public class MOPartition extends Partitioner<Text, Text> { public...
При использовании «лимита» в коллекции шардинга mapreduce я вижу эту ошибку: неизвестное поле m / r...
Мне нужно проанализировать PDF-файлы, находящиеся в HDFS, в программе уменьшения карт в Hadoop....
Поскольку я изучил основы различных стандартов параллельной парадигмы, таких как OpenMP, MPI,...
Допустим, у меня есть модель, которая выглядит следующим образом: public class Blog { public string...
У меня есть 3 части к этому вопросу: У меня есть приложение, в котором пользователи создают объекты...
Когда я запускаю mapreduce, я получаю объединенные входные записи больше, чем выходные записи карты
Я новичок в hadoop, я знакомлюсь со стилем программирования с уменьшением карты, но теперь я...
Я бы хотел, чтобы завершенная работа по дискотеке была записана непосредственно в mongodb
У меня есть домашнее задание, в котором я должен получить общее количество отдельных слов в...
Я выполняю несколько длительных операций mapreduce на MongoDB, и я хотел бы получить опид для этой...
Я пишу планировщик Hadoop. Мое планирование требует определения процессорного времени,...
Я заинтересован в реализации фазы сортировки MapReduce;это кажется очень эффективным.Может ли...
Я работаю над простой программой уменьшения карты. Я хочу создать разные файлы после редуктора для...
У меня есть несколько документов, которые выглядят так: {userId: 123, msg:{ timestamp:123456,...
Я очень нуб, когда дело доходит до MapReduce, и я выдернул свои волосы из-за этой проблемы.Надеюсь,...
Я работаю с большим набором данных, хранящихся в HBase. Многие из значений, хранящихся в моих...
У меня установлено два кластера HDFS, C1 и C2. Очевидно, что оба хранят большой объем данных, но...
Структура данных, с которой я работаю, состоит из объекта, который имеет много встроенных объектов...
Я хотел бы синхронизировать данные с файловой системой Hadoop. Эти данные предназначены для...
Я пытаюсь научиться использовать Python API Yelp для MapReduce, MRJob. Их простой пример со...