У меня есть простая программа сокращения карт, в которой моя карта и примитивы сокращения выглядят...
Есть ли способ в Hadoop гарантировать, что каждый редуктор получает только один ключ, который...
Как создать jar hadoop, который включает все зависимости в папке lib, используя Gradle?По сути,...
Фон Мой работодатель постепенно переводит нашу ресурсоемкую логику обработки ETL и бэкэнда с MySQL...
Мы можем предоставить входные файлы мапперу как FileInputFormat.setInputPaths (conf, inputPath);...
Моя задание hadoop генерирует большое количество файлов в HDFS, и я хочу написать отдельный поток,...
Я запустил небольшой кластер из двух узлов и заметил, что мастер остается полностью бездействующим,...
Я должен сделать проект Распределенный рендеринг трехмерного изображения. Я могу использовать...
Я хотел бы начать работать с анализом большого количества необработанных HTML-страниц в...
Я пробовал Каскадирование, но я не вижу никакого преимущества по сравнению с классическим подходом...
Я пытаюсь добавить несколько файлов в распределенный кеш hadoop. На самом деле я не знаю имен...
Я рассматриваю возможность использования hadoop / mapreduce для решения проекта и не совсем понял,...
Я читаю о MapReduce, и меня смущает следующее: Предположим, у нас есть файл с 1 миллионом записей...
Я слежу за книгой Hadoop: полное руководство . Я запутался в примере 3-1. Существует исходный файл...
Я создал простой драйвер MapReduce, который реализует интерфейс инструмента.Но когда я пытаюсь...
Я пытаюсь отфильтровать строки из таблицы HBase, используя два объекта SingleColumnValueFilter ,...
Конфигурация Hadoop Map-Reduction обеспечивает mapred.task.limit.maxvmem и mapred.task.default
Я получаю несколько маленьких файлов в свой входной каталог, которые я хочу объединить в один файл...
Я изучаю варианты запуска приложения hadoop в локальной системе. Как и во многих приложениях,...
У меня есть следующий сценарий: Используемая версия Pig 0.70 Пример структуры каталогов HDFS:...
Извините за мой плохой английский. Я надеюсь, вы поймете мою проблему. У меня есть вопрос о...
Я занимаюсь разработкой веб-сканера, который подходит для хранения данных? Cassandra или Hadoop...
Вот как в настоящее время работает Hadoop: если происходит сбой редуктора (например, генерируется...
Я смотрю на необходимость импортировать много данных в реальном времени в индекс Lucene. Он будет...
Я собираюсь заменить набор сценариев Python ETL, которые выполняют ежечасные / ежечасные сводки...