Я хочу проанализировать XML-файлы, имеющие несколько внутренних текстов.
<tag>
Outertext_before a tag
<innertag_1> innercontent </innertag_1>
Outertext_after inner tag 1
<innertag_2> innercontent </innertag_2>
Outertext_after inner tag 2
</tag>
Ожидаемый результат:
PARENT_TAG PRESENT_TAG SERIALNUMBER_FROM_PARENT CONTENT
tag, tag, 1, Outertext_before a tag
tag, innertag_1, 2, innercontent
tag, tag, 3, Outertext_after inner tag 1
tag, innertag_2, 4, innercontent
tag, tag, 5, Outertext_after inner tag 2
Как выполнить синтаксический анализ XML, имеющих innertext. Я попытался использовать lxml.etree, но мне не удается выполнить синтаксический анализ последовательно.