Этот пример немного запутан, но, если у вас есть форма с именем Form1
, с элементом управления WebBrowser с именем webBrowser1
, переменная content
будет содержать разметку, которая формирует документ:
private void Form1_Load(object sender, EventArgs e)
{
webBrowser1.Url = new Uri(@"http://www.robertwray.co.uk/");
}
private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
{
var document = webBrowser1.Document;
var documentAsIHtmlDocument3 = (mshtml.IHTMLDocument3)document.DomDocument;
var content = documentAsIHtmlDocument3.documentElement.innerHTML;
}
Необходимые "извлечения" из HtmlDocument.DomDocument
находятся в обработчике webBrowser1_DocumentCompleted
.
Примечание: mshtml
получается путем добавления ссылки COM в «Библиотеку объектов Microsoft HTML» (она же: mshtml.dll)