По моему мнению, Aurora MySQL не является хорошим вариантом для анализа больших данных.Это вытекает из ограничений MySQL InnoDB, а также из-за дополнительных ограничений для Aurora по отношению к MySQL InnoDB.Например, вы не найдете там таких функций, как сжатие данных или столбчатый формат.
Когда речь идет о Aurora, вы можете использовать, например, Aurora Parallel Query, но он не поддерживает многораздельные таблицы.
https://aws.amazon.com/blogs/aws/new-parallel-query-for-amazon-aurora/
Другой вариант - подключиться напрямую к Aurora с помощью AWS Glue и выполнить анализ, но в этом случае у вас могут возникнуть проблемы с производительностью базы данных.Это может быть узким местом.
https://docs.aws.amazon.com/glue/latest/dg/populate-add-connection.html
Я предлагаю импортировать / экспортировать данные в s3, используя LOAD DATA FROM S3 / SELECT INTO OUTFILE S3 в S3, а затем выполнить анализ с помощьюиспользуя клей или EMR.Вам также следует рассмотреть возможность использования Redshift вместо Aurora.