Использование AWS Glue custom classifier with nested jsons - PullRequest
0 голосов
/ 28 мая 2020

Я пытаюсь использовать классификаторы AWS Glue для сканирования файла json. Формат примерно следующий:

{ id: "123",
  id2: "456",
  id3: {
    set1: {
      code1: "123",
      code2: "456"
    },
    set2: {
      code1: "123",
      code2: "456"
    }
  }
}

Я хочу, чтобы поисковый робот только возвращал часть «id3». Я использовал веб-сайт AWS , но что бы я ни делал, поисковый робот всегда возвращает весь файл json. Я пробовал делать $.id3[*], $["id3"][*], $.id3.[*] et c., Но он всегда возвращает единственный файл, а не только id3, что мне и нужно.

Возможно, я действительно не понимаю, что таблица на веб-сайте означает, и я не пытаюсь подобрать правильные комбинации:

* 
  -> Wildcard character. Available anywhere a name or numeric are required in the JSON path.
.<name> Dot-notated child. 
  -> Specifies a child field in a JSON object.
['<name>']  Bracket-notated child. 
  -> Specifies child field in a JSON object. Only a single child field can be specified.
[<number>]  Array index. 
  -> Specifies the value of an array by index.

Поскольку в моем файле нет массивов, я чувствую, что не должен использовать квадратную скобку, [] , но нет возможности использовать подстановочный знак * без квадратных скобок. (Выполнение $.id3.* вызывает ошибку как недопустимый json путь).

Любая помощь будет принята.

...