Python XML Parse (используя схему для генерации набора данных) - PullRequest
1 голос
/ 29 октября 2010

Я ищу, чтобы проанализировать xml-файл с помощью Python, и мне было интересно, есть ли какой-нибудь способ автоматизации задачи путем ручного обхода всех узлов / атрибутов xml с использованием библиотеки xml.dom.minidom.

По сути, было бы замечательно, если бы я мог загрузить XML-схему для XML-файла, который я читаю, и затем автоматически создать некий тип структуры / набора данных со всеми данными в XML.

В земле C # это возможно путем создания строго типизированного класса набора данных из XML-схемы и последующего использования этого набора данных для чтения XML-файла.

Есть ли какой-нибудь эквивалент в Python?

Ответы [ 3 ]

3 голосов
/ 29 октября 2010

lxml - это сверхнадежный пакет синтаксического анализа xml.Он включает в себя подпакет lxml.objectify , который создаст дерево объектов из вашего xml.

Он не генерирует класс из схемы - это, вероятно, скорее C # / Javaвещь - но она действительно проверяет схему, чтобы вы знали, какой тип объекта вы возвращаете (см. «утверждение схемы»).

0 голосов
/ 29 октября 2010

Вы можете взглянуть на lxml.objectify, особенно на E-factory.Это на самом деле не эквивалентно инструментам ADO, но тем не менее это может оказаться полезным.

0 голосов
/ 29 октября 2010

эй чувак - возьми BeautifulSoup - это супер библиотека.ГОЛОВО на сайт scraperwiki.com

может вам помочь!

...