Как настроить формат файла результатов AWS Athena - PullRequest
0 голосов
/ 11 октября 2018

В настоящее время результаты запроса Athena представлены в формате tsv в S3.Есть ли способ настроить запросы Athena для возврата результатов в формате Parquet.

1 Ответ

0 голосов
/ 11 октября 2018

Ответ

В данный момент невозможно сделать это напрямую с Афиной.Когда дело доходит до настройки результата запроса Athena, вы можете только настроить местоположение результата запроса и конфигурацию шифрования.

Обходной путь

1) С октября Athena поддерживает запрос CTAS, выможно попробовать использовать эту функцию.

https://docs.aws.amazon.com/athena/latest/ug/ctas.html

https://docs.aws.amazon.com/athena/latest/ug/ctas-examples.html

Я думаю, что пример 4 или 5 может вас заинтересовать.

2) ВыМожно создать скрипт Python и использовать фреймворк Boto3.Вот пример, вы можете адаптировать этот скрипт к вашим требованиям и добавить результаты сохранения запросов в формат паркета.

https://gist.github.com/schledererj/b2e2a800998d61af2bbdd1cd50e08b76

3) Если вы хотите преобразовать свои данные, вам следует использоватьскорее такие сервисы как AWS EMR или AWS Glue.

...