Я использую Aspose.Html для обработки HTML-файла, но его обработка HTML-сущностей вызывает у меня проблемы.
Рассмотрим следующий HTML-файл:
<html>
<head>
<title>Page Title</title>
</head>
<body>
<div>
<h1> <a href="blabla.com">Visit blabla!</a></h1>
</div>
</body>
</html>
Для иллюстрацииВ целях выполнения я запускаю следующий код (C #):
HTMLDocument doc = new HTMLDocument("entities.html");
doc.Save("entities_saved.html");
Я получаю следующий HTML-файл, который не эквивалентен (в браузере вместо отображения кода отображается ссылка на blabla.com):
<html>
<head>
<title>Page Title</title>
</head>
<body>
<div>
<h1> <a href="blabla.com">Visit blabla!</a></h1>
</div>
</body>
</html>
Как обрабатывать объекты HTML, чтобы информация не терялась?