Мы работаем с системой производственного класса, в которой мы хотим запустить вторичный наменод в...
Мы работаем с 3-узловым кластером AWS EMR (1 NameNode, 2 DataNodes). Наблюдается, что указание...
Я разработал программу Map Reduce для выполнения массовой загрузки HBase, используя технику,...
Я новичок в EMR, и теперь я не могу запустить свое приложение Spark на EMR. Мой вопрос заключается...
Я сохраняю фрейм данных в s3, используя блокнот zeppelin. df=spark.sql("select * from...
После создания внешней таблицы кустов в EMR, например: create external table A . like B stored as...
Я импортирую таблицу из oracle в каталог s3 с помощью Amazon EMR. Файлы импортируются как avro, а...
Я пытаюсь развернуть предварительно EMR через наш конфигурационный файл запуска EMR JSON. Я решил...
Я читаю сжатый файл .gz в pyspark на EMR. Но файл имеет неправильный формат (это файл json с...
Мне нужно обновить /etc/hosts для всех экземпляров моего кластера EMR (EMR AMI 4.3). Весь сценарий...
Я пытаюсь запустить задание hadoop, которое создает, копирует, удаляет файлы на S3 и при...
У меня большой объем данных, около 500 ТБ, мне нужно сделать несколько ETL для этих данных. Эти...
Я пытаюсь получить данные с сервера SQL в таблицу Hive, используя Spark в блокноте Zeppelin. Я...
Я получаю эту ошибку Master Instance Group: Exceeded EC2 Instance Quota, когда я создаю новый...
У меня есть одна таблица с большим количеством типов данных, и у некоторых данных есть одна...
Я только что настроил кластер EMR со встроенными Spark, JupyterHub и так далее. Я могу получить...
У меня есть идея сделать то же самое с cli следующим образом: yarn application --status...
Я хотел бы использовать EMR и Spark для обработки отчета об инвентаризации AWS S3, сгенерированного...
У меня есть сценарий, в котором у меня есть настройка AWS EMR с несколькими приложениями, такими...
У меня есть искровое задание, которое выполняет чередование наименьших квадратов (ALS) на матрице...
Я запускаю искровые задания на Yarn на EMR 5.14 (hadoop 2.8.3). Могу ли я использовать улучшенную...
Может ли кто-нибудь указать мне URL-адрес, который объясняет, как данные передаются из S3 в память...
Я создаю кластер amazon emr, где одним из шагов является сценарий bash, выполняемый script-runner
Я использую EMR 5.4 и отправляю искровое задание в Yarn Когда я пытаюсь получить журнал с yarn logs...
Конфигурация программного обеспечения: Hadoop distribution:Amazon 2.8.3 Applications:Hive 2.3.2,...