Я пытаюсь запустить задание на Elastic MapReduce (EMR) с помощью пользовательского фляги.Я пытаюсь...
Я использую конвейер упругого преобразования карт, который использует выходные данные из нескольких...
Возможно, это то же самое, что и в Hadoop, но я просто не смог найти формат или пример написания...
Таким образом, достаточно легко обрабатывать внешние банки, если использовать hadoop прямо вверх. У...
Я настраиваю кластер Hadoop на EC2, и мне интересно, как сделать DFS. Все мои данные в настоящее...
Я использую Pig на Amazon Elastic Map-Reduce для выполнения пакетной аналитики. Мои входные файлы...
Есть несколько больших наборов данных (25 ГБ +, загружаемых в Интернете), которые я хочу поиграть с...
Я пытаюсь поиграть с набором данных Google Ngrams, используя Amazon Elastic Map Reduce.Есть...
Я запускаю скрипт Python MapReduce поверх реализации Amazons EMR Hadoop. В результате из основных...
Я хотел бы загрузить каталог из локальной файловой системы EMR в s3 в виде архивного файла. Есть ли...
Я использую библиотеку boto для создания потока работ в Amazons Elastic MapReduce Webservice (EMR)....
Я пытаюсь использовать Amazon Elastic Map Reduce для запуска серии симуляций нескольких миллионов...
Я пытался использовать потоковую передачу Hadoop в Amazon EMR для простого подсчета слов для набора...
У меня много данных в домене Amazon Simple DB.Я хочу запустить Hive в Elastic Map Reduce (поверх...
Я работаю над потоковым рабочим процессом Hadoop для Amazon Elastic Map Reduce, который включает...
Я тестирую задания в EMR, и каждый тест занимает много времени для запуска. Есть ли способ...