public string ExtractContent(string html)
{
var doc = new HtmlDocument();
doc.LoadHtml(html);
foreach (var node in doc.QuerySelectorAll("footer"))
{
node.Remove();
}
foreach (var node in doc.QuerySelectorAll("aside"))
{
node.Remove();
}
return doc.Text;
}
В полученном HTML я все еще вижу элемент <footer>
и элемент <aside>
.
Я думаю, что узлы не являются ссылочными типами? Как я могу удалить эти элементы из HTML?
Спасибо!