>>> from lxml import etree
>>> treetop = etree.fromstring(anxmlstring)
преобразует xml в строке в структуру данных Python, как и
>>> othertree = etree.parse(somexmlurl)
где somexmlurl
- это путь к локальному XML-файлу или URL-адресу XML-файла в Интернете.
Структура данных Python, которую предоставляют эти функции (известная как «дерево элементов», откуда имя модуля etree
), хорошо документирована здесь - все классы, функции, методы и т. Д., Которые рассматриваемая структура данных Python. Кстати, он близко соответствует тому, который поддерживается в стандартной библиотеке Python.
Если вам нужна какая-то другая структура данных Python, вам придется пройтись по структуре данных Python, которую возвращает lxml, как указано выше, и самостоятельно построить свою другую структуру данных на основе собранной информации. ; lxml не может вам конкретно помочь, за исключением того, что он предлагает несколько помощников для поиска информации в разобранной структуре, которую он возвращает, поэтому сбор указанной информации является гибкой и простой задачей (опять же, см. документацию по URL выше).