Я пытаюсь отформатировать имеющиеся у меня XML-записи, чтобы я мог использовать xmltextreader без ошибок. Я добавил заголовок и нижний колонтитул по умолчанию, если заметил, что нет открывающих или закрывающих тегов. Я удаляю недопустимые символы и проверяю юникод, но всегда нахожу проблему, когда запись проскальзывает и выдает ошибку:
данные на корневом уровне неверны
и когда я проверяю, что запись пропускается через процесс очистки или просто имеет где-то несоответствующий тег. Теперь я использую
Dim stringSplitter() As String = {"</entry>"}
' split the file content based on the closing entry tag
sampleResults = _html.Split(stringSplitter, StringSplitOptions.RemoveEmptyEntries)
чтобы разделить мой xml на отдельные записи, прежде чем я начну процесс очистки. Вот мои заголовки по умолчанию;
Private defaultheader = "xmlns=""http://www.w3.org/2005/Atom"""
Private headerl As String = "<?xml version=""1.0"" encoding=""utf-8""?>" & vbNewLine & "<entry " & defaultNameSpace & ">"
Private footer As String = "</entry>"
есть ли какой-либо инструмент в .net Framework, который может обнаруживать и очищать несопоставленные теги, чтобы я мог заставить это работать