Мой XML-файл выглядит так:
<strings>
<string>Bla <b>One & Two</b> Foo</string>
</strings>
Я хочу извлечь содержимое каждого , сохраняя при этом внутренние теги. То есть я хотел бы видеть следующую строку Python: u "Bla One & Two Foo". В качестве альтернативы, я думаю, я мог бы остановиться на "Bla One & Two Foo", а затем попытаться заменить сущности самостоятельно.
В настоящее время я использую lxml, который позволяет перебирать вложенные теги, пропускать текст, не входящий в тег, или, альтернативно, весь текстовый контент (itertext), теряя информацию тега. Я, наверное, что-то упускаю.
Если возможно, я бы предпочел сохранить lxml, хотя при необходимости могу переключиться на другую библиотеку.