Я пытаюсь написать скрипт на python, который принимает один или два XML-файла и выводит один или два новых файла на основе содержимого входных файлов. Я пытался написать этот скрипт с помощью модуля minidom. Тем не менее, входные файлы содержат несколько экземпляров escape-символа
& # Xa;
внутри атрибутов узла. К сожалению, в выходных файлах эти символы были преобразованы в разные символы, которые кажутся символами новой строки.
Например, строка во входном файле, такая как:
<Entry text="For English For Hearing Impaired
Press 3 on Keypad"
Будет выводиться как
<Entry text="For English For Hearing Impaired
Press 3 on Keypad"
Я читал, что это вызвано минидомом, так как он не позволяет экранировать символы в атрибутах xml (я думаю). Это правда? И, если да, то какой инструмент / метод лучше всего использовать для анализа xml-файла в документе python, манипулирования узлами и обмена ими с другими документами и вывода документов обратно в новые файлы?
Если это поможет, я также анализировал и сохранял эти файлы, используя кодировку utf-8. Я не знаю, является ли это частью проблемы или нет. Спасибо за любую помощь, которую может оказать любой.
-Алекс Кайзер