разбирать xml, атрибут которого включает двойную кавычку с lxml - PullRequest
0 голосов
/ 24 октября 2019

Я не могу получить исследование xpath для атрибута "Frais de Services" с lxml: у меня есть xml-файл, содержимое которого выглядит следующим образом:

  <column caption='Choix Découpage'   name='[Aujourd&apos;Hui Parameter (copy 2)]'>
            <alias key='&quot;Frais de Services&quot;' value='Offline Fees' />
  </column>
from lxml import etree
import sys
tree = etree.parse('test.xml')
root = tree.getroot()
print([node.attrib['key'] for node in root.xpath("//alias")]) # we get ['"Billetterie Ferroviaire"']

Я пробовал много взломать, ни один не работает (я не могу понять, почему lxml внутренне изменить первоначальные «Предопределенные сущности»):

root.xpath('//alias[@key="\"Frais de Services\""]')
root.xpath('//alias[@key="&quot;Frais de Services&quot;"]')
...