У меня есть S3-ведро, называемое "atest-bucket".Внутри этого ведра у меня есть каталог с именем...
Мне нужно перезагрузить presto-server на EMR, чтобы загрузить мои plugin.Со ссылкой на официальные...
У меня есть небольшая работа Spark, которая собирает файлы из s3, группирует их по ключу и...
Я создал кластер EMR, в котором есть один главный и один подчиненный узлы. В настоящее время,...
Я пытаюсь выполнить spark submit в AWS EMR, чтобы выполнить простой проект, в котором используется...
У меня есть несколько заданий PySpark на EMR, и я хотел бы создать их как веб-сервис.Любое...
Я пытаюсь включить шаг EMR, который является любой задачей Pyspark, в мой скрипт оболочки следующим...
В моем приложении я читаю 40 ГБ текстовых файлов, которые полностью распределены по 188 файлам. Я...
У меня есть приложение, которое использует около 20 RDD для выполнения необходимых вычислений.Можно...
Мне необходимо периодически выполнять задания ETL для файлов, хранящихся на AWS S3. Чтобы не...
У нас есть кластер AWS EMR, где пользователи выполняют тысячи запросов через JDBC. Иногда просто...
У меня есть данные JSON, структурированные так: [ {"eventName": "unmuteClick",...
Я хочу загрузить данные из корзины s3 в Pig на EMR, и мой исходный формат файла - паркет: Ниже...
Я кладу файлы паркета в корзину S3 и использую Athena для запроса.Я хотел бы внести изменения в...
Я не могу найти информацию, которая описывает, сколько экземпляров приложений Spark с spark-submit...
Я использую Elasticsearch для запроса данных. Я запрашиваю медицинский термин, а взамен получаю код...
Я хотел бы добавлять шаг в кластер emr каждые 5 минут, не используя лямбду, я думал использовать...
Я попытался подключить свой сервер UNIX с моего ноутбука, он подключается нормально, если я...
Я использую aws с emr over ec2 и получаю тонны сборов за передачу данных, около 900 ГБ в течение...
Меня немного смущает экосистема AWS EMR, и мне было интересно, какой инструмент я могу использовать...
Я не могу использовать консоль AWS, но у меня полный доступ к API EMR и EC2. Учитывая ClusterID,...
Я изучаю курс «Удар Apache с помощью Scala - Практические занятия с большими данными» в Udemy. В...
Я использую spark over emr и пишу скрипт pyspark, Я получаю сообщение об ошибке при попытке from...
Я использую aws с emr и пытаюсь перейти на сценарий начальной загрузки, чтобы установить для Python...
Я пытаюсь запустить 2 шага одновременно в EMR. Однако я всегда выполняю первый шаг и второй...