У меня есть таблица данных Athena в S3, которая действует как исходная таблица со столбцами id
, name
, event
. Для каждого уникального значения name
в этой таблице я хотел бы вывести новую таблицу со всеми строками, соответствующими этому значению name
, и сохранить ее в другой сегмент в S3. Это приведет к тому, что в S3 сохранится n новых файлов, где n - это также число уникальных name
значений в исходной таблице.
Я пробовал отдельные запросы Athena в Lambda с использованием PARTITION BY
и запросов CTAS, но не могу получить желаемый результат. Кажется, что AWS Клей может получить ожидаемый результат, но я читал в Интернете, что он дороже, и, возможно, я смогу получить ожидаемый результат, используя Lambda.
Как я могу сохранить новый файл (предпочтительно JSON формат), который содержит все строки, соответствующие каждому уникальному name
в S3?
Желательно, чтобы я запускал его один раз в день для обновления данные хранятся в name
, но основной вопрос на данный момент вызывает вопрос выше.