Я управляю кластером Hadoop, который используется несколькими пользователями. Мы часто выполняем...
У меня есть поток ~ 10 заданий Hadoop.У меня есть последовательность XML-файлов, которые...
Я работаю с Hadoop 0.20 и хочу использовать NLinesInputFormat, но эта функциональность отсутствует?...
В hadoop предположим, что число узлов фиксировано (без сбоя сервера во время выполнения), если я...
Есть ли способ передать аргументы конструктора Mapper в Hadoop?Возможно, через какую-то библиотеку,...
У меня есть файл, в котором набор из каждых четырех строк представляет запись. например, первые...
Я новичок в hadoop и пытаюсь настроить hadoop в псевдораспределенном режиме, и когда я пытаюсь...
У меня есть два последовательных Job1 и Job2.Вывод Job1 записывается в HDFS.Job2 загрузит выходные...
Я настроил hadoop с использованием kerberos, все работает нормально, я могу просматривать hdfs,...
Является ли CDH (Cloudera Distribution для hadoop) открытым исходным кодом или коммерчески? Любые...
Этот предыдущий вопрос адресован как импортировать такие модули, как nltk для потоковой передачи...
У меня есть работа только с Mapper PrepareData, которая необходима для преобразования текстовых...
Я ищу лучшие практики для обработки данных.Итак, вот что я получил: 1.000.000 узлов типа «А».Каждый...
Я попытался развернуть 20- пример группы новостей с mahout, похоже, работает нормально. Из...
У меня есть структура HDFS что-то вроде a/b/file1.gz a/b/file2.gz a/c/file3.gz a/c/file4.gz Я...
Я пытаюсь выполнить псевдораспределенную установку Hadoop на моей машине Gentoo. Я хочу, чтобы...
Мне нужно реализовать распределенную нагрузку на процессор, основанную на Java. База данных не...
Я очень новичок в PIG, и у меня возникло ощущение основной проблемы. У меня есть строка кода,...
Я начинаю разработку приложения Hadoop, и я хотел бы управлять им через пару MBeans. Я...
Мы используем Hadoop через API Hadoop C / C ++ (libhdfs.so). Мы используем последнюю стабильную...
Я использовал Hadoop в псевдораспределенном режиме, и все работало нормально. Но потом мне пришлось...
Есть ли способ установить коэффициент репликации для вывода конкретного задания MapReduce,...
Я использую виртуальную машину Cloudera (CH3).Я скопировал простой UDF в мой текстовый редактор, но...
Я пытаюсь настроить Amazon Cloud для запуска некоторых заданий hadoop MapReduce, но я пытаюсь...
Я использую HIVE с двумя таблицами, похожими (более или менее): -TABLE1 определяется как...