Как классифицировать вложенные теги XML в клею aws при захвате атрибутов - PullRequest
0 голосов
/ 29 августа 2018

У меня есть следующий пример xml:

<ParentTag xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" ID="68067108" ClientID="1" DocumentCreationDate="2018-04-10T00:00:05" DocumentVersion="9" EventClassID="1987" STBLogCreationDate="2018-04-09T11:38:59" SampleID="496" xsi:noNamespaceSchemaLocation="/opt/web/ams_proxy/webapps/ams_proxy/WEB-INF/amsXmlSchema_DTVPA_Version9.xsd">
    <Event EventTime="2018-04-09T11:41:02">
        <LiveViewEvent>
            <Channel channelObjectId="3062323">
                <Stream streamId="40" streamType="Video"/>
                <Stream streamId="41" streamType="Audio"/>
                <Stream streamId="65535" streamType="Data"/>
            </Channel>
        </LiveViewEvent>
    </Event>
</ParentTag>

Мне нужен идентификатор в ParentTag , EventTime и LiveViewEvent данных (channelObject, видео, аудио и данные). Я дошел до точки получения данных в LiveViewEvent (в виде структуры) и EventTime , но кажется, что атрибуты ParentTag пропущены. Возможно, я должен также упомянуть, что существуют другие типы событий (кроме LiveViewEvent с другими данными, но они мне не нужны.

Любая помощь высоко ценится.

Спасибо,

1 Ответ

0 голосов
/ 30 августа 2018

Я думаю, что единственный способ - это создать классификатор в консоли AWS Glue с тегом Row как «ParentTag», и тогда вы сможете выбрать необходимые данные, используя тип данных struct и array.

...