Мне нужно реализовать следующую карту -> Reduce1 -> Reduce 2 означает, что Reduce2 - это отдельная...
У меня есть запрос в SQL, который я пытаюсь перевести на Pig Latin (для использования в кластере...
Я пытаюсь выполнить настройку одного узла для hadoop, как указано в следующей ссылке http://hadoop
Я новичок в Кассандре и Улей. Теперь я хочу интегрировать кассандру с Hadoop-Hive, но как мне...
Мне нужен какой-то совет.Я работаю над новым стартапом в области интеллектуального анализа данных
Я использую пример программы WordCount для Hadoop для обработки большого набора небольших файлов /...
Я пытаюсь передать сложную запись между маппером и редуктором, точнее ArrayWritable of...
Я хочу иметь возможность сделать стандартный diff для двух больших файлов. У меня есть кое-что, что...
id col1 col2 ... coln --------------------- foo barA barB ... foo barD barX boo barA barC foo barC...
Мне нужно получить список имен заданий, которые в данный момент выполняются, но hadoop -job list...
У меня есть работа с mapreduce, написанная на Python.Программа была успешно протестирована в Linux...
Я хотел бы использовать весь файл как отдельную запись для обработки MAP с именем файла в качестве...
Я настроил hadoop в псевдораспределенном режиме (кластер с одним узлом) на моем Ubuntu 10.04. У...
Я начинаю использовать Mahout для кластеризации, но мне трудно пытаться преобразовать sql (mysql)...
Я написал задание mapreduce для извлечения некоторой информации из набора данных.Набор данных - это...
Задача mapred - это очень простой 'wordcount', реализованный в Java (plz, см. http://wiki.apache
Я новичок в уменьшении карты Hadoop, я хотел знать, что есть некоторый тип выходного формата,...
Немного упрощая мою проблему, у меня есть набор текстовых файлов с «записями», которые разделены...
Я использую Pig на Amazon Elastic Map-Reduce для выполнения пакетной аналитики. Мои входные файлы...
Я пытаюсь выполнить задание Hadoop на удаленном кластере hadoop.Ниже приведен мой код....
Я провел кластеризационный тест на просканированных страницах (более 25 тыс. Документов; набор...
У меня есть файл jar "Tsp.jar", который я сделал сам. Эти же самые jar-файлы хорошо работают при...
Довольно странный вопрос, но кто-нибудь знает, какой тип MapReduce использует в части сортировки в...
Я хочу знать, могу ли я сравнить два последовательных задания в Hadoop.Если нет, то я буду...
Распределенные файловые системы, такие как Google File System и Hadoop, не поддерживают...