Вопросы с тегом Hadoop-потоковый

1 голос

1 ответ

Использование Java класса в качестве Mapper и Python Script в качестве редуктора

Я пытаюсь запустить hadoop с потоковой передачей.У меня есть два файла.Одним из них является...

Ragit / 11 февраля 2012

1 голос

1 ответ

Hadoop API: выходной формат для редуктора

Я полностью сбит с толку API hadoop. (угадайте, что он постоянно меняется) Если я не ошибаюсь,...

Ravi Bhatt / 10 февраля 2012

1 голос

3 ответов

Amazon Elastic Map Reduce запускает один или несколько процессов сопоставления для каждого экземпляра?

У меня вопрос: должен ли я сам заботиться о многопроцессорности в моем маппере (читать задачи из...

izhak / 03 февраля 2012

0 голосов

0 ответов

Записи отсутствуют в o / p при установке numReduceTasks = 0 в потоковой передаче Hadoop

Как уже упоминалось в заголовке, не могли бы вы предложить, в чем может быть проблема. Команда...

Piyush Kansal / 16 января 2012

2 голосов

2 ответов

Можем ли мы каскадировать несколько заданий MapReduce в Hadoop Streaming (язык: Python)

Я использую Python и должен работать по следующему сценарию, используя Hadoop Streaming: а) Map1->...

Piyush Kansal / 14 января 2012

5 голосов

1 ответ

Hadoop создает исключение ClassCastException для типа ключа java.nio.ByteBuffer

Я использую "hadoop-0.20.203.0rc1.tar.gz" для настройки моего кластера.Всякий раз, когда я...

samarth / 13 января 2012

0 голосов

1 ответ

Клиентское разделение в Hadoop

У меня есть файл, в котором у меня есть записи типа 'курица' '10'. Я хочу разделить данные на...

Deepika Sethi / 10 января 2012

2 голосов

2 ответов

Hadoop Streaming - установить максимальное количество карт на узел

Можно ли задать количество задач карты, запущенных на узел. Я использую Hadoop Streaming для...

Rajesh / 28 декабря 2011

1 голос

1 ответ

Не удается прочитать сгенерированные файлы последовательности Mahout с потоковой передачей

Я пытаюсь передать файл последовательности, сгенерированный одним из примеров Mahout, чтобы увидеть...

magicalo / 01 декабря 2011

0 голосов

1 ответ

Как сказать Hadoop не удалять временную директорию из HDFS, когда задача убита?

По умолчанию задачи карты hadoop записывают обработанные записи в файлы во временном каталоге в...

azec-pdx / 30 ноября 2011

0 голосов

2 ответов

Настройка имени хоста ведомого с использованием внутреннего IP-адреса - несколько сетевых карт

В моей среде Hadoop мне необходимо настроить подчиненные узлы таким образом, чтобы при обмене...

Ken / 29 ноября 2011

3 голосов

2 ответов

Действительно ли hadoop справляется с отказом датододы?

В нашей настройке hadoop, когда происходит сбой (или) datanode (или) hadoop не отвечает на datanode...

Boolean / 29 ноября 2011

4 голосов

3 ответов

Сортировка по значению в Hadoop из файла

У меня есть файл, содержащий строку, затем пробел, а затем число в каждой строке. Пример: Line1:...

Deepika Sethi / 28 ноября 2011

8 голосов

1 ответ

Как прочитать последовательный файл hadoop?

У меня есть последовательный файл, который является выводом задания Hadoop Map-Reduce. В этом файле...

samarth / 25 ноября 2011

1 голос

2 ответов

Есть ли способ для полностью распределенной программы Hadoop / MapReduce, чтобы ее отдельные узлы считывали локальные входные файлы?

Я пытаюсь настроить полностью распределенный экземпляр Hadoop / MapReduce, где каждый узел будет...

Ken / 21 ноября 2011

2 голосов

2 ответов

Эффективный способ уменьшить результаты MapReduce?

Я написал задание MapReduce, в котором для набора данных были учтены ngram. Результаты представлены...

Dolan Antenucci / 05 ноября 2011

0 голосов

1 ответ

Hadoop-Streaming: Как вычисляет задача сокращения, уменьшает размер ввода?и как это исправить?

Я вижу следующее в журнале отслеживания заданий: 011-11-02 10:04:09,595 WARN org.apache.hadoop

daydreamer / 02 ноября 2011

0 голосов

2 ответов

в Map / Reduce можно было только перезапустить уменьшение?

возможно ли перезапустить только уменьшение задания на карте / уменьшение задания? я предполагаю...

daydreamer / 31 октября 2011

0 голосов

2 ответов

Hadoop-Streaming: редуктор в состоянии ожидания, не запускается?

У меня есть карта уменьшения задания , которая работала нормально, пока я не начал видеть некоторые...

daydreamer / 31 октября 2011

0 голосов

1 ответ

Не удается сообщить о заданиях потоковой передачи hadoop?

Все задания успешно выполнялись с использованием потоковой передачи hadoop, но внезапно я начал...

daydreamer / 31 октября 2011

2 голосов

1 ответ

кластер hadoop: задача карты выполняется только на одном компьютере, а не на всех

У меня есть hadoop cluster of three machines, где одна машина действует как ведущая и ведомая....

daydreamer / 26 октября 2011

2 голосов

2 ответов

потоковая передача hadoop: как просматривать журналы приложений?

Я вижу все журналы hadoop на моем /usr/local/hadoop/logs пути а где посмотреть журналы уровня...

daydreamer / 25 октября 2011

3 голосов

1 ответ

Кластер Hadoop. Нужно ли повторять код на всех компьютерах перед запуском задания?

Это то, что смущает меня, когда я использую пример wordcount, я держу код на master и позволяю ему...

daydreamer / 25 октября 2011

0 голосов

2 ответов

hadoop-streaming: запись вывода в разные файлы

Вот сценарий Reducer1 / Mapper - - Reducer2 \ ReducerN В редукторе я хочу записать данные в разные...

daydreamer / 10 октября 2011

1 голос

0 ответов

копирование в и из hdfs в Hadoop Streaming

Я задавал подобный вопрос к этому ранее, но после некоторого изучения у меня есть лучшее понимание...

fozziethebeat / 07 октября 2011