Я читал некоторое время о том, как загрузить мои данные S3 в Redshift, команду COPY, Glue и т. Д. Мой конвейер почти полностью находится в NIFI, что-то вроде: extract_data-> insert to S3-> Excute Lamda process для преобразования данных илиобогащать его с помощью Athena, в 2 или 3 этапа, в другое ведро S3 (давайте назовем его обработанным сегментом).
Теперь я хочу продолжить этот конвейер, загружая данные из обработанного фрагмента и вставляя их в красное смещение,У меня для этого создана пустая таблица.
Идея состоит в том, чтобы постепенно добавлять в некоторые таблицы и в другие, чтобы удалить все данные, загруженные в тот день, и перезагрузить их.
Может кто-нибудь дать мненамек с чего начать? Спасибо!