Разбор данных в XML-файле с использованием Python - PullRequest
0 голосов
/ 09 июля 2011

У меня есть XML-файл, в котором мне нужно удалить теги XML, где, если возможно, я могу использовать подстановочный знак, потому что данные в тегах будут отличаться от информации. См. Ниже XML:

 <relationship relation="1">
        <sourcedid>
            <source>xxxxx</source>
            <id>AbDT-1398</id>  ***this data will be different for each grouping****
        </sourcedid>
        <label/>
    </relationship>

В основном мне нужно найти в xml-файле информацию о группировке и использовать подстановочный знак в тегах и удалить всю группировку. На протяжении всего моего xml тег указан, но данные - это то, что меняется.

1 Ответ

2 голосов
/ 09 июля 2011

Если я правильно понял, вы хотите удалить определенные теги (и, в конечном итоге, их содержимое) из вашего XML-файла.Попробуйте использовать lxml для обработки файла lxml.Посмотрите на эти функции из lxml.etree.

Удалите все элементы с предоставленными именами теговиз дерева или поддерева.Это удалит элементы и все их поддерево, включая все их атрибуты, текстовое содержимое и потомков.

Это удалит элементы и их атрибуты, но не их текстовое / хвостовое содержимое или потомков.Вместо этого он объединит текстовое содержимое и дочерние элементы своего родителя.

Это то, что вы ищете?Если да, то на SO есть хороший ответ, вам стоит взглянуть.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...