Мне нужно удалить пробелы между тегами xml, например если оригинальный XML выглядит так:
<node1>
<node2>
<node3>foo</node3>
</node2>
</node1>
Я бы хотел, чтобы конечный результат был сжатым до одной строки:
<node1><node2><node3>foo</node3></node2></node1>
Обратите внимание, что я не буду контролировать структуру xml, поэтому решение должно быть достаточно универсальным, чтобы можно было обрабатывать любой действительный xml. Также xml может содержать блоки CDATA, которые мне нужно исключить из этого хруста и оставить их как есть.
Пока у меня есть пара идей: (1) проанализировать xml как текст и найти начало и конец тегов <и> (2) другой подход - это загрузить документ xml и перейти от узла к узлу и напечатать новый документ путем объединения тегов.
Я думаю, что любой из методов сработает, но я бы не стал изобретать колесо здесь, так что, может быть, есть библиотека Python, которая уже делает что-то подобное? Если нет, то о каких проблемах / подводных камнях нужно знать, когда выкатываете мой собственный cruncher ? Любые рекомендации?
EDIT
Спасибо всем за ответы / предложения, решения Триптиха и Ван Гейла работают для меня и делают именно то, что я хочу. Хотел бы я принять оба ответа.