Метод normalize может обрабатывать специальные символы и сущности для вас.
public abstract void normalize ()
Добавлено на уровне API 1
Переводит все текстовые узлы на всю глубину поддерева под этим узлом, включая узлы атрибутов, в «нормальную» форму, где только структура (например, элементы, комментарии, инструкции по обработке, разделы CDATA и ссылки на сущности) разделяет текстовые узлыт. е. нет ни соседних текстовых узлов, ни пустых текстовых узлов.Это можно использовать для обеспечения того, чтобы представление DOM документа было таким же, как если бы оно было сохранено и повторно загружено, и полезно, когда операции (такие как поиск XPointer [XPointer]), которые зависят от конкретной древовидной структуры документа,использоваться.Если параметр "normalize-characters" объекта DOMConfiguration, присоединенного к Node.ownerDocument, имеет значение true, этот метод также полностью нормализует символы текстовых узлов.
Примечание. В тех случаях, когда документ содержит CDATASections,одной операции нормализации может быть недостаточно, поскольку XPointers не различают узлы Text и узлы CDATASection.