Я пытаюсь запустить hadoop с потоковой передачей.У меня есть два файла.Одним из них является...
Я полностью сбит с толку API hadoop. (угадайте, что он постоянно меняется) Если я не ошибаюсь,...
У меня вопрос: должен ли я сам заботиться о многопроцессорности в моем маппере (читать задачи из...
Как уже упоминалось в заголовке, не могли бы вы предложить, в чем может быть проблема. Команда...
Я использую Python и должен работать по следующему сценарию, используя Hadoop Streaming: а) Map1->...
Я использую "hadoop-0.20.203.0rc1.tar.gz" для настройки моего кластера.Всякий раз, когда я...
У меня есть файл, в котором у меня есть записи типа 'курица' '10'. Я хочу разделить данные на...
Можно ли задать количество задач карты, запущенных на узел. Я использую Hadoop Streaming для...
Я пытаюсь передать файл последовательности, сгенерированный одним из примеров Mahout, чтобы увидеть...
По умолчанию задачи карты hadoop записывают обработанные записи в файлы во временном каталоге в...
В моей среде Hadoop мне необходимо настроить подчиненные узлы таким образом, чтобы при обмене...
В нашей настройке hadoop, когда происходит сбой (или) datanode (или) hadoop не отвечает на datanode...
У меня есть файл, содержащий строку, затем пробел, а затем число в каждой строке. Пример: Line1:...
У меня есть последовательный файл, который является выводом задания Hadoop Map-Reduce. В этом файле...
Я пытаюсь настроить полностью распределенный экземпляр Hadoop / MapReduce, где каждый узел будет...
Я написал задание MapReduce, в котором для набора данных были учтены ngram. Результаты представлены...
Я вижу следующее в журнале отслеживания заданий: 011-11-02 10:04:09,595 WARN org.apache.hadoop
возможно ли перезапустить только уменьшение задания на карте / уменьшение задания? я предполагаю...
У меня есть карта уменьшения задания , которая работала нормально, пока я не начал видеть некоторые...
Все задания успешно выполнялись с использованием потоковой передачи hadoop, но внезапно я начал...
У меня есть hadoop cluster of three machines, где одна машина действует как ведущая и ведомая....
Я вижу все журналы hadoop на моем /usr/local/hadoop/logs пути а где посмотреть журналы уровня...
Это то, что смущает меня, когда я использую пример wordcount, я держу код на master и позволяю ему...
Вот сценарий Reducer1 / Mapper - - Reducer2 \ ReducerN В редукторе я хочу записать данные в разные...
Я задавал подобный вопрос к этому ранее, но после некоторого изучения у меня есть лучшее понимание...