Внешние таблицы Amazon Redshift Spectrum доступны только для чтения. Вы не можете обновить их из Redshift (например, с помощью команд INSERT).
Следовательно, вам потребуется метод для создания файлов непосредственно в S3.
UNLOAD
, конечно, может сделать это, но не может сохранить данные в структуре разделов.
Amazon EMR, действительно, будет хорошим вариантом. В наши дни плата взимается посекундно, поэтому для экспорта данных потребуется только достаточно долго. Вы можете использовать предпочитаемый инструмент (например, Hive или Spark), чтобы экспортировать данные из Redshift, а затем записать их во внешнюю многораздельную таблицу.
Например, см .: Включение Amazon Redshift Analytics с помощью Apache Spark и Amazon Machine Learning | Блог больших данных AWS
Другой вариант может быть AWS Glue. Я не слишком знаком с ним, но он может выводиться в разделы, так что это может быть еще более простой способ для достижения вашей цели!
См .: Управление разделами для вывода ETL в AWS Glue - AWS Glue