У меня есть куча файлов Parquet на S3, я хочу загрузить их в красное смещение наиболее оптимальным способом.
Каждый файл разбит на несколько кусков ...... Какой самый оптимальный способ загрузки данных из S3 в Redshift?
Кроме того, как вы создаете определение целевой таблицы в Redshift? Есть ли способ вывести схему из Parquet и создать таблицу программно? Я считаю, что есть способ сделать это с помощью спектра Redshift, но я хочу знать, можно ли это сделать в сценариях.
Ценю вашу помощь!
Я рассматриваю все инструменты AWS, такие как Glue, Lambda и т. Д., Чтобы сделать это наиболее оптимальным способом (с точки зрения производительности, безопасности и стоимости).