Чтение нескольких файлов json с S3 с помощью Amazon Athena - PullRequest
0 голосов
/ 05 мая 2020

Я сохраняю ежедневную деятельность сотрудника в папке как сотрудник. json вот моя структура данных, хранящихся в S3. Теперь я хочу прочитать действия всех сотрудников за определенный диапазон дат. Как это сделать с помощью сервиса Amazon Athena? Или мне следует написать для этого код клиента.

empId1-->2020-03-01-->employee.json
         2020-03-02-->employee.json
         2020-03-03-->employee.json
         2020-03-04-->employee.json
         2020-03-05-->employee.json

empId2-->2020-03-01-->employee.json
         2020-03-02-->employee.json
         2020-03-03-->employee.json
         2020-03-04-->employee.json
         2020-03-05-->employee.json

empId3-->2020-03-01-->employee.json
         2020-03-02-->employee.json
         2020-03-03-->employee.json
         2020-03-04-->employee.json
         2020-03-05-->employee.json

empId4-->2020-03-01-->employee.json
         2020-03-02-->employee.json
         2020-03-03-->employee.json
         2020-03-04-->employee.json
         2020-03-05-->employee.json

1 Ответ

0 голосов
/ 05 мая 2020

Попробуйте взглянуть на разделы в Athena: https://docs.aws.amazon.com/athena/latest/ug/partitions.html.

Это позволит вам выполнить запрос к подмножеству баз файлов S3 без префикса.

...