.NET XmlDocument: почему DOCTYPE изменяется после сохранения? - PullRequest
3 голосов
/ 12 ноября 2008

Я открываю файл XML с помощью .NET XmlReader и сохраняю файл в другом имени файла, и кажется, что объявление DOCTYPE изменяется между двумя файлами. Хотя новый сохраненный файл все еще является действительным XML, мне было интересно, почему он настаивал на изменении оригинальных тегов.

Dim oXmlSettings As Xml.XmlReaderSettings = New Xml.XmlReaderSettings()
oXmlSettings.XmlResolver = Nothing
oXmlSettings.CheckCharacters = False
oXmlSettings.ProhibitDtd = False
oXmlSettings.IgnoreWhitespace = True

Dim oXmlDoc As XmlReader = XmlReader.Create(pathToOriginalXml, oXmlSettings)
Dim oDoc As XmlDocument = New XmlDocument()
oDoc.Load(oXmlDoc)
oDoc.Save(pathToNewXml)

Следующее (в оригинальном документе):

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd">

становится (обратите внимание на символы [] в конце):

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd"[]>

Ответы [ 2 ]

8 голосов
/ 01 июля 2009

Ошибка в System.Xml при установке XmlDocument.XmlResolver = null. Обходной путь должен создать пользовательский XmlTextWriter:

    private class NullSubsetXmlTextWriter : XmlTextWriter
    {
        public NullSubsetXmlTextWriter(String inputFileName, Encoding encoding)
            : base(inputFileName, encoding)
        {
        }
        public override void WriteDocType(string name, string pubid, string sysid, string subset)
        {
            if (subset == String.Empty)
            {
                subset = null;
            }
            base.WriteDocType(name, pubid, sysid, subset);
        }
    }

В своем коде создайте новый NullSubsetXmlTextWriter (pathToNewXml, Encoding.UTF8) и передайте этот объект в метод oDoc.Save ().

Вот пример поддержки Microsoft , где вы можете прочитать об обходном пути (он описывает обходной путь, но не предоставляет код).

1 голос
/ 13 ноября 2008

Вероятно, библиотека анализирует элемент DOCTYPE во внутреннюю структуру, а затем преобразует структуру обратно в текст. Он не хранит исходную строковую форму.

...