Я пишу Map Reduce Program для следующей задачи: Поскольку в файле есть пустые строки и заголовок,...
Я пытаюсь изучить hadoop, и в документации есть пример, подобный приведенному ниже.Я не могу понять...
Выходные папки, кроме имен по умолчанию, не создаются в корзине S3.Программа редуктора использует...
У меня RDD как Array[(a, b), (a, c), (a, d)]. Я хочу отобразить его как ((a, b), 1), ((a, c), 1),...
Итак, я запустил TestDFSIO в своем кластере, чтобы увидеть пропускную способность и среднюю...
Я видел, как утверждается, что задания являются идемпотентными, когда мы пишем работу с большими...
У меня есть работа на карте. мой dfs.blockSize равен 134217728 (128M). У меня очень большая таблица...
Я слышал, что задача карты сохраняет свои данные на диске. Но это замедлит отображение, особенно...
Каждая строка моих данных - это конкатенация года и нескольких символов.Я хочу получить первые 3...
Возможно ли иметь два значения в MapReduce? Мой CSV выглядит так: month, date, deviceCategory,...
ОБНОВЛЕНИЕ: я исправил свою проблему с этим Optional<Collection<Pair<String,...
Итак, я запускаю 50 МБ данных с WordCount в моем кластере Hadoop. я запускаю тест на 5 разных...
Я пытаюсь получить данные из представления couchdb: пытаясь объединить различные документы для...
У меня есть 3-х узловый кластер hadoop (капли DigitalOcean): hadoop-master настроен как namenode и...
Я пытаюсь оптимизировать выбор данных из большой таблицы (массив объектов). Я хотел бы сохранить...
Я использую Hadoop MultipleInputs (чтобы быть конкретными mapreduce & НЕ maped API). Я хочу...
Моя задача - анализировать логи Кеннеди Космического Центра с помощью Apache Spark. Код работает,...
У меня есть таблица этой формы в улье (До): AB_dimp|SF_0060H00000nhSrmQAE|EBA Order...
Вопрос 1: Я хочу найти файлы журнала MapReduce, чтобы проверить значения некоторых переменных в...
Когда я запускаю программу map-Reduce в кластере, входной путь рассматривается как выходной путь,...
Я пытаюсь протестировать работу MapReduce в Java отдельно, которая является частью рабочего...
В двух разных программах, которые используют разные типы записи в коллекцию MongoDB, в эту...
Я работаю над проблемой MapReduce, в которой я хочу отфильтровать каждый вывод раздела Map. Я хочу...
Я хочу добавить стороннюю флягу, методы которой используются в моей карте, сокращают работу. Я...
Я пытаюсь экспортировать метрики кластера Hadoop с использованием JMX. Работает с HDFS и...