Я полностью сбит с толку API hadoop. (угадайте, что он постоянно меняется) Если я не ошибаюсь,...
Я верю (верил?), Что понимаю, как работает вторичная сортировка в Hadoop.Я создал промежуточный...
Я знаю, как использовать sqoop через командную строку. Но не знаю, как вызвать команду sqoop с...
Я хочу вычислить хэш sha256 для разделения входных данных, и вывод mapper должен быть равен (ключ,...
В Hadoop, как обрабатывать ежедневно растущие данные: Например: 1-й день у меня может быть 1...
Я пытаюсь запустить Hbase Shell на новом кластере Hbase на EC2 (1 главный узел и 8 подчиненных) #...
После того, как я попытался отформатировать nameNode (впервые). Я получил это сообщение 3 раза:...
Если я хочу использовать zookeeper в качестве рабочей очереди и подключать к нему отдельных...
Я видел Hadoop-on-Demand и интеграцию Hadoop в SGE.Насколько я понимаю, это требует прав...
В новом API (apache.hadoop.mapreduce.KeyValueTextInputFormat), как указать разделитель...
Может кто-нибудь сказать мне, что означает эта ошибка? и как я могу получить вывод? Exception in...
Я определил свой собственный формат ввода следующим образом, который предотвращает разбиение файла:...
Я пытаюсь отказаться от необходимости использования метода setOutputValueGroupingComparator для...
Мой редуктор выглядит следующим образом public static class Reduce extends MapReduceBase implements...
Моя программа wordcount дает мне желаемый выходной файл, в котором есть все слова и их вхождения....
Мой редуктор по какой-то причине истекает.Я пытаюсь -Dmapred.task.timeout изменить таймауты, но...
В попытке выучить Hadoop я практикую нерешенные вопросы программирования из книги «Hadoop в...
У меня есть входные данные, которые выглядят следующим образом: 3070801,1963,1096,,"BE"...
Я работаю над Java-программой для взаимодействия с уже работающим кластером hadoop. Программа...
Во время работы над реализацией Hadoop в псевдораспределенной операции я обнаружил следующее...
Я хочу исключить повторяющиеся имена файлов в моем выводе программы инвертированного индекса hadoop...
Я много искал, но не смог найти решение этой проблемы. На самом деле файл, к которому я хочу...
У меня 32-битный компьютер с Windows 7, мне нужно установить hadoop и попробовать его, я проверил...
Как мы получаем твиттер (твиты) в HDFS для автономного анализа. у нас есть требование для анализа...
В книге Hadoop говорится, что мы можем указать размер блока для каждого файла во время создания...