Внешние таблицы Amazon Redshift Spectrum доступны только для чтения. Вы не можете обновить их из Redshift (например, с помощью команд INSERT).
Следовательно, вам потребуется метод для создания файлов непосредственно в S3.
UNLOAD
, конечно, может сделать это, но не может сохранить данные в структуре разделов.
Amazon EMR, действительно, будет хорошим вариантом. В наши дни плата взимается посекундно, поэтому для экспорта данных потребуется только достаточно долго. Вы можете использовать предпочитаемый инструмент (например, Hive или Spark), чтобы экспортировать данные из Redshift, а затем записать их во внешнюю многораздельную таблицу.
Например, см .: Включение Amazon Redshift Analytics с помощью Apache Spark и Amazon Machine Learning | Блог больших данных AWS
![spark-redshift](https://d2908q01vomqb2.cloudfront.net/b6692ea5df920cad691c20319a6fffd7a4a766b8/2016/12/29/o_powering_redshift_analytics_2.gif)
Другой вариант может быть AWS Glue. Я не слишком знаком с ним, но он может выводиться в разделы, так что это может быть еще более простой способ для достижения вашей цели!
См .: Управление разделами для вывода ETL в AWS Glue - AWS Glue