Как s3-выбрать все данные во внутреннем массиве файла паркета - PullRequest
0 голосов
/ 03 июня 2019

У меня есть файлы паркета на s3, которые нужно запросить с помощью S3 Select. Файлы паркета генерируются из файлов JSON с внутренними массивами. Запрос S3 Select может получить первый массив, но если я попытался запросить записи во внутреннем массиве, он не сможет вернуть идентификаторы. Сказать, что это неверный источник данных

Что я пробовал:

Looking up documentation on Amazon proves no use
Multiple formats of the s3 select query

Структура Json

  {
     "Array": [
        {
          "Id": "1"
        },
        {
          "Id": "2"
        }
     ]
   }

Запрос

  select s.Array[*].id from s3object s

Ожидайте, чтобы все идентификаторы вернулись из запроса, поэтому должны возвращать Id 1 и 2.

...