Как запросить вложенный XML-файл в AWS Athena через Glue - PullRequest
1 голос
/ 21 марта 2019

Я хочу, чтобы вложенный XML-файл запрашивал у AWS Athena с помощью клея AWS.

<Files>
<File>
<Charges>
<charge>
<FRNo>99988881111</FRNo>
<amount>25.0</amount>
<Date>2019-02-25</Date>
<chargeType>Recur</chargeType>
<phoneNo>4444000012</phoneNo>
</charge>

<charge>
<FRNo>99988881111</FRNo>
<amount>40.0</amount>
<Date>2019-02-25</Date>
<chargeType>Recur</chargeType>
<phoneNo>4444000012</phoneNo>
</charge>

</Charges>


<FRNo>99988881111</FRNo>
<address>New YORK</address>
<amount>111</amount>
<DN>100000</DN>
 <name>Rite</name>
<phoneNo>4444000012</phoneNo>
<tax>8.0</tax>
</File>
</Files>

Вот так у меня есть 10k записей.Я думаю, что мы должны сделать некоторые изменения в работе ETL.Дайте мне знать для любой другой информации.

1 Ответ

1 голос
/ 23 марта 2019

В настоящее время Amazon Athena не поддерживает формат файлов XML.Список поддерживаемых форматов можно найти здесь: https://docs.aws.amazon.com/athena/latest/ug/supported-format.html

Поскольку AWS Glue поддерживает XML в качестве формата ввода ETL (https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-format.html),), вы можете сначала преобразовать свои данные из XML в JSON, а затем запроситьДанные JSON с использованием Athena.

...