Да, этого можно достичь с помощью Glue двумя способами:
Первый подход:
Запустите сканер клея на всех этих таблицах и загрузите все эти таблицы в вашу работу Glue из каталога Glue.
Как только вы загрузите их в несколько динамических кадров Glue, вы можете выбрать столбцы вместе с ключом соединения и присоединить их.
Затем объедините эти DynamicFrames и запишите объединенный результат обратно в таблицу MySql RDS.
При таком подходе вы будете загружать все столбцы из нескольких таблиц. а затем выбирая необходимые столбцы внутри вашей работы Glue и присоединяйте их.
Второй подход:
Вы можете создать запрос SQL, чтобы выбрать и объединить все эти несколько таблиц и pu sh до MySQL engine .
Затем результат вычисляется на MySQL engine и вы загружаете этот результат в Spark DatFrame .
Final ste p будет преобразовывать этот DataFrame в DynamicFrame и записывать его в таблицу MySQL.
При таком подходе вы делегируете вычислительную задачу в MySQL, и это повлияет на базу данных. двигатель, если ваши столы слишком большие.