Question

Я новичок в клею AWS и попытался выяснить, смогу ли я создать наше озеро данных в S3. Для этого я создал задание ETL для запуска на небольшой таблице MySQL в RDS. После завершения задания в S3 было создано несколько файлов CSV, и большинство из них пустые.

Я хочу понять:

Почему данные разбиты на несколько файлов?
Можно ли запустить задание на нескольких столах? В консоли AWS это позволяет выбрать только одну таблицу в качестве исходного хранилища данных. Означает ли это, что мне нужно создать работу для каждого стола?

Kishore Bharathy · Answer 1 · 29 июня 2018

Это связано с распределением ключа ваших данных. Насколько я знаю, вы можете балансировать ключ только вручную.
Возможный дубликат: как можно с помощью клеевого задания aws загрузить несколько таблиц в красное смещение .

Несколько файлов в S3 создаются после запуска задания ETL, использующего соединение RDS MySQL

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Несколько файлов в S3 создаются после запуска задания ETL, использующего соединение RDS MySQL

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы