Как разобрать второе дерево XML в файле - PullRequest
1 голос
/ 30 января 2012

Предположим, у меня есть XML-файл, например

<?xml version="1.0" encoding="utf-8"?>
<items>
  <?xml version="1.0" encoding="utf-8"?>
  <items>
    <item>
      <price>1500</price>
      <info> asfgfdff</info>
    </item>
  </items>

Как выполнить синтаксический анализ, чтобы синтаксический анализатор выбрал недавно обновленное дерево XML?

1 Ответ

0 голосов
/ 30 января 2012
with open('file','r') as f:
    newestXml = []
    for line in f.readlines():
        if re.search('^<\?xml',line):
            newestXml = [line]
        else:
            newestXml.append(line)

В конце цикла newestXml будет содержать все строки от последнего вхождения <?xml до конца файла.Теперь вы можете комбинировать строки и использовать синтаксический анализатор xml для анализа xml.

Примечание. Сейчас я не могу проверить этот код, поэтому он может содержать небольшие ошибки, но я надеюсь, что идея поможет вам.

...