Как я могу прочитать XML-файл, используя Python ElementTree, если в XML есть несколько элементов верхнего уровня?
У меня есть XML-файл, который я хотел бы прочитать, используя Python ElementTree.
К сожалению, у него есть несколько тегов верхнего уровня. Я бы обернул <doc>...</doc>
вокруг XML, за исключением того, что я должен поставить <doc>
после <?xml>
и <!DOCTYPE>
полей. Но выяснить, где заканчивается <!DOCTYPE>
, нетривиально.
Что у меня есть:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE FOO BAR "foo.dtd" [
<!ENTITY ...>
<!ENTITY ...>
<!ENTITY ...>
]>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
Что я хочу:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE FOO BAR "foo.dtd" [
<!ENTITY ...>
<!ENTITY ...>
<!ENTITY ...>
]>
<DOC>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
</DOC>
Обратите внимание, что имя тега ARTICLE может измениться, поэтому я не могу найти его.
Может кто-нибудь предложить мне, как я могу добавить вложение <doc>...</doc>
после заголовка XML, или предложить другой обходной путь?