Я пытаюсь использовать сервис AWS Glue для чтения данных из экземпляра RDS, извлечения данных и...
У меня есть некоторые json-файлы, хранящиеся в s3, и мне нужно преобразовать их в папке папки в...
Я получаю ошибку несоответствия схемы при запросе данных паркета из Афины. Ошибка:...
Привет, в этом случае группа безопасности базы данных открыта для всего входящего трафика (ВСЕ...
Я пытаюсь сгенерировать файл из Dataframe, который я создал в AWS-Glue, я пытаюсь дать ему...
Я написал склеивающее задание, которое экспортирует таблицу DynamoDb и сохраняет ее на S3 в формате...
Я хочу вставить данные из s3 bucket csv через AWS Glue, но вставка данных зависит от данных,...
У меня есть следующая работа в AWS Glue, которая в основном считывает данные из одной таблицы и...
Я пытаюсь провести некоторое POC-тестирование, чтобы файлы S3 parquet можно было запрашивать через...
(Этот вопрос очень похож на Сохранение нескольких элементов в файлах json в AWS Athena ) У меня...
Абсолютно новый для AWS Glue и Python, так что я надеюсь, что кто-то может указать мне правильное...
Я запускаю сценарий ETL для получения таблицы из RDS в s3, но сценарий ETL все пути терпят неудачу,...
У меня есть таблица DynamodB с данными примерно 10 ГБ.Мне нужно выгрузить его на s3 или в хранилище...
Можно ли написать сценарий ETL с использованием AWS Glue, который выполняет запрос в локальной базе...
Мне нужно включить пользовательский оператор SQL в задание AWS Glue Я подозреваю, что мне нужно...
В настоящее время у меня есть несколько тысяч сжатых GZIP-файлов без заголовка в формате S3 в S3,...
При работе сканера клея AWS он не распознает столбцы меток времени. Я правильно отформатировал...
Я использую Glue для переноса данных из таблицы в каталоге Glue в другую таблицу в экземпляре RDS
Я попытался создать сканер клея, который сканирует таблицу красного смещения. Сканер клея успешно...
Я всегда получаю ошибки при попытке преобразовать мои данные CSV в паркет. Я предполагаю, потому...
Я пытаюсь загрузить XML-файлы из соединения S3 в задании AWS Glue ETL.Файлы загружаются «правильно»...
Я использую PySpark на AWS Glue.Появляется при записи набора данных со столбцом даты, используемым...
Кто-нибудь здесь пишет ETL или ELT на Python (чисто Python - не PySpark)?Если да, каковы некоторые...
Не могли бы вы сообщить мне, доступна ли такая функция в текущей версии mlflow?
Я пытаюсь оптимизировать работу Glue / PySpark с помощью предикатов push down. start = date(2019, 2...