Python - Удалить дубликаты тегов из XML - PullRequest
0 голосов
/ 20 марта 2019

У меня есть файл, в котором несколько сообщений XML записаны в одну строку. Таким образом, каждая строка файла представляет собой отдельную строку XML.

Некоторые сообщения XML имеют повторяющиеся теги XML. Я хочу иметь возможность циклически проходить по файлу, захватывать каждый тег XML и данные внутри тега и добавлять в список, и если тег XML и данные уже существуют в списке, я хочу затем удалить тег XML и данные в теге из файла.

Пример

XML до:

<tag> data </tag><tag>data</tag><tag>data</tag>

XML после

<tag>data</data>
...