Нужна помощь в разборе XML, имеющего innertexts - PullRequest
0 голосов
/ 24 октября 2019

Я хочу проанализировать XML-файлы, имеющие несколько внутренних текстов.

<tag>
Outertext_before a tag
<innertag_1> innercontent </innertag_1>
Outertext_after inner tag 1
<innertag_2> innercontent </innertag_2>
Outertext_after inner tag 2
</tag>

Ожидаемый результат:

PARENT_TAG  PRESENT_TAG SERIALNUMBER_FROM_PARENT    CONTENT

tag,    tag,        1,  Outertext_before a tag
tag,    innertag_1, 2,  innercontent
tag,    tag,        3,  Outertext_after inner tag 1
tag,    innertag_2, 4,  innercontent
tag,    tag,        5,  Outertext_after inner tag 2

Как выполнить синтаксический анализ XML, имеющих innertext. Я попытался использовать lxml.etree, но мне не удается выполнить синтаксический анализ последовательно.

...