Я пытаюсь извлечь необработанный XML из файла XML.
Так что, если мои данные:
<xml>
... Lots of XML ...
<getThese>
<clonedKey>1</clonedKey>
<clonedKey>2</clonedKey>
<clonedKey>3</clonedKey>
<randomStuff>this is a sentence</randomStuff>
</getThese>
<getThese>
<clonedKey>6</clonedKey>
<clonedKey>8</clonedKey>
<clonedKey>3</clonedKey>
<randomStuff>more words</randomStuff>
</getThese>
... Lots of XML ...
</xml>
Я могу легко получить нужные мне ключи, используя etree:
from lxml import etree
search_me = etree.fromstring(xml_str)
search_me.findall('./xml/getThis')
Но как мне получить фактический контент в виде необработанного XML? Все, что я вижу в документах, это для получения элементов / текста / атрибутов, а не сырого XML.
Мой желаемый вывод - список с двумя элементами:
["<getThese>
<clonedKey>1</clonedKey>
<clonedKey>2</clonedKey>
<clonedKey>3</clonedKey>
<randomStuff>this is a sentence</randomStuff>
</getThese>",
"<getThese>
<clonedKey>6</clonedKey>
<clonedKey>8</clonedKey>
<clonedKey>3</clonedKey>
<randomStuff>more words</randomStuff>
</getThese>"]