Мне нужно извлечь данные между тегами, как указано ниже. Также я хочу объединить данные, если данные соответствуют одному и тому же идентификатору.
Например, согласно приведенному ниже XML оба тега находятся на вкладках, соответствующих одному и тому же идентификатору «00F1234A». Следовательно, «World» необходимо извлечь.
xml_string="
<w:r w:rsid="00F1234A">
<w:rPr>
</w:rPr>
<w:t>Hello</w:t>
</w:r>
<w:r w:rsid="00F1234A">
<w:rPr>
</w:rPr>
<w:t xml:space="preserve">World</w:t>
</w:r>"
В настоящее время я извлекаю данные между тегами со следующим регулярным выражением
re.findall("<w:t>(.+?)</w:t>",xml_string)
это дает мне Hello, но не Hello World
как я могу объединить данные в соответствии с тем же идентификатором, который в этом случае "00F1234A"