Мне нужно удалить что-нибудь между тегами XML, особенно пробелами и символами новой строки.
Например, удаление пробелов и новостных лент из:
\ n <идентификатор узла = "что угодно">
чтобы получить:
<идентификатор узла = "что угодно">
Это не предназначено для синтаксического анализа XML вручную , а скорее для подготовки XML-данных перед их анализом инструментом. Чтобы быть более конкретным, я использую Hpricot (Ruby) для разбора XML, и, к сожалению, в настоящее время мы застряли на версии 0.6.164, так что ... я не знаю о более свежих версиях, но эта часто возвращает странные узлы (Объекты), которые содержат только пробелы и разрывы строк. Таким образом, идея состоит в том, чтобы очистить XML перед преобразованием его в документ Hpricot. Приветствуются альтернативные решения.
Пример из теста: NoMethodError: неопределенный метод `children 'для" \ n ": Hpricot :: Text
Интересная часть здесь - это не NoMethodError, потому что это нормально, но элемент Hpricot :: Text содержит только символ новой строки и ничего более.