Избегайте проверки пространств имен XmlDocument в C # - PullRequest
0 голосов
/ 29 апреля 2010

Я пытаюсь найти способ сделать отступ для HTML-файла, я использую XMLDocument и просто использую XmlTextWriter.

Однако я не могу правильно отформатировать его для документов HTML, поскольку он проверяет тип документа и пытается загрузить его.

Существует ли «тупой» механизм отступа, который не проверяет и не проверяет документ и делает отступ с максимальными усилиями? Файлы имеют размер 4-10 МБ и генерируются автоматически, мы должны обрабатывать их внутренне - это нормально, пользователь может подождать, я просто хочу не переходить на новый процесс и т. Д.

Вот мой код для справки

        using (MemoryStream ms = new MemoryStream())
        using (XmlTextWriter xtw = new XmlTextWriter(ms, Encoding.Unicode))
        {
            XmlDocument doc = new XmlDocument();
            // LoadSettings the unformatted XML text string into an instance
            // of the XML Document Object Model (DOM)
            doc.LoadXml(content);

            // Set the formatting property of the XML Text Writer to indented
            // the text writer is where the indenting will be performed
            xtw.Formatting = Formatting.Indented;

            // write dom xml to the xmltextwriter
            doc.WriteContentTo(xtw);

            // Flush the contents of the text writer
            // to the memory stream, which is simply a memory file
            xtw.Flush();

            // set to start of the memory stream (file)
            ms.Seek(0, SeekOrigin.Begin);

            // create a reader to read the contents of
            // the memory stream (file)
            using (StreamReader sr = new StreamReader(ms))
                return sr.ReadToEnd();
        }

По сути, сейчас я использую MemoryStream, XmlTextWriter и XmlDocument, после отступа я считываю его обратно из MemoryStream и возвращаю как строку. Сбои случаются для документов XHTML и некоторых документов HTML 4, потому что он пытается получить dtds. Я попытался установить XmlResolver как ноль, но безрезультатно: (

1 Ответ

0 голосов
/ 30 апреля 2010

Без доступа к конкретному X [H] TML, вызывающему проблемы, трудно понять, сработает ли это, но вы пробовали использовать XDocument вместо этого?

XDocument xdoc = XDocument.Parse(xml);
string formatted = xdoc.ToString();
...