Я импортирую данные из файла logs.csv в таблицу Hbase, используя команду hbase org.apache.hadoop
У меня есть следующий СДР: Col1 Col2 "abc" "123a" "def"...
Возможно ли реализовать опцию множественных входов с различным отображением для каждого, как...
Я пытаюсь запустить случайное задание, но, когда получено 4 задания, не удалось, оно не...
Я настроил hadoop в Windows 7, сославшись на https://github
Рассматривая классический пример функций Map () и Reduce (), я пишу программу, которая принимает в...
Я делаю левое соединение (левое соединение B) между двумя таблицами A и B и записываю результаты в...
Недавно мне дали задание в классе операционных систем, в котором объясняется, что мы должны...
После запуска start-all.sh: Starting namenodes on [localhost] . Starting datanodes Starting...
С здесь : Согласно руководству по определению hadoop "Внутри каждого раздела фоновый поток...
Если содержимое буфера памяти, в которое выводит функция карты, распределяется по дисковым файлам,...
Я пытался вычислить общее время входа в систему для сотрудников в моей программе уменьшения карты,...
Я использую pyspark, чтобы найти предложения для общих друзей между пользователями.Исходный входной...
SET default_parallel 1; Вышеприведенный оператор отлично работает, когда выполняется через хрюканье
Я пытаюсь прочитать в CSV-файл из командной строки и сделать несколько расчетов по столбцам.Однако...
У меня есть набор входов для редуктора от картографа: (1939, [121, 79, 83, 28]) (1980, [0, 211,...
У меня есть два файла с 10 тысячами строк.Моя цель - вычислить расстояние Жакара для каждой пары...
У меня есть некоторые проблемы с созданием карты, уменьшающей работу для обработки файла cdv
Моя программа выполняет несколько заданий уменьшения карты, по одному на каждую строку параметров в...
Я работаю с Apache Hive и должен быть уверен, как работает встроенная хеш-функция.Я нашел эту...
Я написал приложение MapReduce, которое работает на 6 узлах компьютеров.Я уверен, что мой алгоритм...
Когда я запускаю задание, выдается ошибка. Container [pid=8278...
Допустим, у меня есть массив, такой как: gamers = [ { player: 'john', points: 20, }, {...
Я новичок в мире программирования и искры RDD.Я должен проанализировать несколько файлов журнала...
У меня есть следующая схема выводов public static class RecordMapper extends Mapper<Object, Text...