Чувствительность к регистру Beautiful Stone Soup в именах XML - PullRequest
4 голосов
/ 02 ноября 2011

Я пытаюсь использовать Beautiful Stone Soup (BSS) для изменения существующего XML с именами тегов с учетом регистра.Когда BSS читает в XML, он приводит все имена тегов в нижний регистр, и я не могу найти простой способ восстановить исходный шаблон капитализации при записи его обратно в файл.Это вызывает проблемы в нисходящем направлении, потому что выходной XML больше не проверяет соответствие схеме (поскольку схема ожидает исходную прописную букву).Есть ли флаг, который я могу установить при первом прочтении, который скажет BSS обрабатывать имена тегов как регистрозависимые?

1 Ответ

2 голосов
/ 02 ноября 2011

Вы пробовали ElementTree вместо этого? Без сомнения, Beautiful Soup отлично подходит для извлечения данных из HTML. Но ElementTree в значительной степени устанавливает планку для Pythonic обработки XML.

Прошло много времени с тех пор, как я нуждался в этом, но я не помню, чтобы ET делал что-то нехорошее с именами моих тегов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...