В настоящее время я работаю над созданием озера данных, где мы можем компилировать, объединять и анализировать несколько наборов данных в S3.
Я использую Athena и Quicksight в качестве центральной части этого, чтобы иметь возможность быстро запрашивать и исследовать данные. Чтобы упростить работу Quicksight для конечных пользователей, я создаю множество представлений Athena, которые выполняют некоторые базовые преобразования и агрегации.
Я хотел бы иметь возможность контролировать источники своих представлений и создавать некоторую автоматизацию вокруг них, чтобы мы могли использовать подход, основанный на коде, и не полагаться на то, что пользователи обновляют представления вручную и запускают DDL для обновления определений.
Кажется, что в Cloudformation нет поддержки представлений Athena.
Мой текущий подход заключается в том, чтобы просто сохранить create or replace view as ...
DDL в файле .sql в системе управления версиями, а затем создать какой-то сценарий, который запускает DDL, чтобы его можно было сделать частью решения для непрерывной интеграции.
У кого-нибудь есть опыт автоматизации и CI для представлений Athena?