Я пытаюсь найти способ сделать отступ для HTML-файла, я использую XMLDocument и просто использую XmlTextWriter.
Однако я не могу правильно отформатировать его для документов HTML, поскольку он проверяет тип документа и пытается загрузить его.
Существует ли «тупой» механизм отступа, который не проверяет и не проверяет документ и делает отступ с максимальными усилиями? Файлы имеют размер 4-10 МБ и генерируются автоматически, мы должны обрабатывать их внутренне - это нормально, пользователь может подождать, я просто хочу не переходить на новый процесс и т. Д.
Вот мой код для справки
using (MemoryStream ms = new MemoryStream())
using (XmlTextWriter xtw = new XmlTextWriter(ms, Encoding.Unicode))
{
XmlDocument doc = new XmlDocument();
// LoadSettings the unformatted XML text string into an instance
// of the XML Document Object Model (DOM)
doc.LoadXml(content);
// Set the formatting property of the XML Text Writer to indented
// the text writer is where the indenting will be performed
xtw.Formatting = Formatting.Indented;
// write dom xml to the xmltextwriter
doc.WriteContentTo(xtw);
// Flush the contents of the text writer
// to the memory stream, which is simply a memory file
xtw.Flush();
// set to start of the memory stream (file)
ms.Seek(0, SeekOrigin.Begin);
// create a reader to read the contents of
// the memory stream (file)
using (StreamReader sr = new StreamReader(ms))
return sr.ReadToEnd();
}
По сути, сейчас я использую MemoryStream, XmlTextWriter и XmlDocument, после отступа я считываю его обратно из MemoryStream и возвращаю как строку. Сбои случаются для документов XHTML и некоторых документов HTML 4, потому что он пытается получить dtds. Я попытался установить XmlResolver как ноль, но безрезультатно: (