data.xml
<?xml version="1.0" encoding="UTF-8"?>
<ArticleSet>
<Article>
<LastName>Bojarski</LastName>
<ForeName>-</ForeName>
<Affiliation>-</Affiliation>
</Article>
<Article>
<LastName>Genç</LastName>
<ForeName>Yasemin</ForeName>
<Affiliation>fgjfgnfgn</Affiliation>
</Article>
</ArticleSet>
SAMPLE CODE
from lxml import etree
dom = etree.parse('data.xml')
root = dom.getroot()
for article in dom.xpath('Article[Affiliation="-"]'):
root.remove(article)
dom.write('output.xml')
Этот код удаляет статьи, принадлежность которых равна - т.е.тег принадлежности выглядит как <Affliation>-</Affliation>
, когда я сохраняю оставшийся вывод в output.xml, он анализирует символ Unicode Genç
до Genç
Я хочу сохранить его как есть.
Вывод кода
<ArticleSet>
<Article>
<LastName>Genç</LastName>
<ForeName>Yasemin</ForeName>
<Affiliation>fgjfgnfgn</Affiliation>
</Article>
</ArticleSet>
Требуемый выход
<ArticleSet>
<Article>
<LastName>Genç</LastName>
<ForeName>Yasemin</ForeName>
<Affiliation>fgjfgnfgn</Affiliation>
</Article>
</ArticleSet>