То, что вы пытаетесь сделать, сложно сделать со стандартными библиотеками .NET, если вы не хотите выполнять много трудного анализа. Если есть какие-то рифмы или причины для ваших нескончаемых тегов, это очень поможет. Например, есть ли известный список тегов, которые не закрыты? Если так, то поиск и замена не будут плохими.
Но, если он действительно открытый, если любой тег может быть закрыт, вам нужно будет использовать что-то вроде HTML Tidy . Оболочка .Net этого может быть найдена здесь . При таком решении тег <deg>
будет преобразован в <deg/>
. Оболочка HTML Tidy также может исправить некоторые другие проблемы, из-за которых xml будет неправильно сформирован .
Как только ваш файл содержит правильно сформированный xml, вы можете легко загрузить его в xml-объекты. Тогда, если у вас есть другая работа с документом, вы по крайней мере сможете увидеть в формате xml.