в задании hadoop я отображаю несколько XML-файлов и фильтрую идентификатор для каждого элемента (из...
Короткая версия : мне нужно получить массив различных тегов, соответствующих /web/ или любому...
Я хотел бы знать, как указать конфигурации mapreduce, такие как mapred.task.timeout, mapred.min
Я видел это в файле конфигурации шаблона: <property> <name>mapred.map
Я хочу отфильтровать записи из данного файла на основе некоторых критериев, я хочу, чтобы мои...
Моя функция карты должна читать файл для каждого ввода. Этот файл не меняется вообще, он только для...
Может быть, это то, чего мне просто не хватает, но есть ли способ изменить способ, которым...
У меня есть простой документ с именем Структура заказа с полями id, name, userId и timeScheduled....
Мне нужно установить количество редукторов при выполнении операции соединения в Hive.Я не хочу...
Из того небольшого понимания Cassandra, которое у меня есть, кажется, что локальность данных в...
Я новичок в Hadoop и застрял в следующей проблеме. Я пытаюсь сопоставить осколок базы данных...
Хочу просто подтвердить следующее.Пожалуйста, проверьте, правильно ли это: 1. Насколько я понимаю,...
У меня есть огромный CSV-файл, который я хотел бы обработать с помощью Hadoop MapReduce в Amazon...
Я работаю над функцией appengine-mapreduce и изменил демо, чтобы соответствовать моей цели. В...
Я ищу способ выполнения операции GROUP BY в запросе в хранилище данных с использованием MapReduce
Я хочу написать код mapreduce для подсчета количества записей в данном файле CSV. Я не понимаю, что...
Я следовал этому руководству по установке hadoop. Ну, все работает нормально, если я использую \...
Я пытаюсь запустить hadoop с потоковой передачей.У меня есть два файла.Одним из них является...
Пока я играл с appengine-mapreduce, найденным на http://code.google.com/p/appengine-mapreduce/,,...
Допустим, у меня есть три правила: [{ selector: {_id: "1"}, value: {name:...
Я полностью сбит с толку API hadoop. (угадайте, что он постоянно меняется) Если я не ошибаюсь,...
У меня есть документ с вложенным документом: { "_id" : ObjectId("XXXXX"),...
Я верю (верил?), Что понимаю, как работает вторичная сортировка в Hadoop.Я создал промежуточный...
Я хочу вычислить хэш sha256 для разделения входных данных, и вывод mapper должен быть равен (ключ,...
У меня есть приложение Rails 3.1, работающее на Ruby 1.9.2, Mongo 2.0.2, использующее Mongoid в...