Я настроил Hadoop на AWS несколько дней назад и провел тест на количество слов. Но задача не...
Похоже, что при наличии только одного редуктора hadoop не позволяет единственной задаче-редуктору...
Я новичок в уменьшении карты и пытаюсь запустить задание уменьшения карты, используя mrjob пакет...
Я новичок в hadoop. У меня есть вопрос о сортировке значения ключа, когда я соединяю две таблицы с,...
Я пытаюсь получить количество строк входных записей в маппере, запустив job.getCounters()
Файл, который я читаю, us-west Однако та корзина, в которую я пишу, находится у нас на востоке,...
Работа по уменьшению карты порождает несколько картографов и работает в Yarn. Как запустить эти...
У нас есть таблица Hive с тремя разными идентификаторами, все необязательно. В каждой строке должен...
Я импортирую таблицу из oracle в каталог s3 с помощью Amazon EMR. Файлы импортируются как avro, а...
Я использую giraph-1.3, построенный с использованием профиля пряжи. Для запуска я настроил 1...
У нас есть сотни разделов HDFS, которые мы пишем в каждый час дня. Разделы предназначены для...
Попытка настроить систему с одним узлом, и я получаю эту ошибку при запуске hadoop jar...
У нас есть архитектура, которая использует и эластичный поиск, и hadoop для задач почти в реальном...
У меня есть кластер с HDFS в качестве распределенной файловой системы под хранилищем, но я только...
Я настраиваю kerberos с существующим Active Directory в качестве KDC и у меня возникает проблема с...
У меня уже есть управляемая / внутренняя таблица кустов, которая состоит из миллионов строк данных....
У меня есть следующие данные, которые нужно вставить в таблицу улья. Данные имеют разделитель по...
Я пытался переименовать существующий столбец в таблице в новый. Но после изменения имени новый...
df = sc.textFile("hdfs://n21-01-03/algo/ml_platform/downsample_data/nl/20180828/*/part-*
В настоящее время я пытаюсь установить Hadoop-1.4.6 в Windows через cygwin, и в качестве ссылки...
Я искал способ добавить столбец в таблицу Hive через интерфейс Beeline, только когда его нет....
Требует ли ограничение местоположения политики дополнительных разрешений для hadoop s3a? Я вижу...
Чтение файла паркета работает, но получает формат с отступом вместо желаемого формата вывода JSON....
Привет! Я использую верблюда, чтобы получать сообщения из очереди JMS, обрабатывать сообщения,...
Мне нужно обновить /etc/hosts для всех экземпляров моего кластера EMR (EMR AMI 4.3). Весь сценарий...