В унаследованном приложении, которое поддерживает простые текстовые шаблоны для экспорта информации, я создал шаблон, который экспортирует данные в XML. Дело в том, что текстовая информация не может быть экранирована, поэтому я получил <
>
знаков в значениях XML, и код, который я имею в .NET, выдает исключение при разборе XML.
Есть ли способ автоматически исправить XML, прежде чем выбросить его в интерпретатор XML?
Пример:
<node>
Some value which indicates that the quantity < 0.3
</node>
Приведенный выше код должен быть как-то преобразован в
<node>
Some value which indicates that the quantity < 0.3
</node>
Я не могу выполнить это во время экспорта . То, что у меня есть, это конец XML.
Я думал о поиске комбинаций <{node}>
и </{node}>
, а тех, у которых нет совпадений - о побеге. Тем не менее, структура может быть многоуровневой, например:
<node>
<data>
</data>
<node>
<data>
</data>
</node>
</node>
И в таком случае, что следует использовать? Обычный алгоритм синтаксического анализа с тоннами процедурного кода в циклах и рекурсивных функциях, или какая-то альтернатива с использованием регулярных выражений?