HTML Agility Pack HtmlDocument Показать все HTML? - PullRequest
20 голосов
/ 08 апреля 2011

Я использую следующее, чтобы получить веб-страницу, которая отлично работает

    public static HtmlDocument GetWebPageFromUrl(string url)
    {
        var hw = new HtmlWeb();
        return hw.Load(url);
    }

Но как мне выплюнуть все содержимое HTML из HtmlDocument в строку?

Я пробовал HtmlDocument.ToString (), но это не дает мне весь HTML в документе? Есть идеи?

1 Ответ

42 голосов
/ 08 апреля 2011

DocumentNode.OuterHtml содержит полный HTML-код:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.Load("sample.html");
string html = doc.DocumentNode.OuterHtml;

В вашем примере:

public static string GetWebPageHtmlFromUrl(string url)
{
    var hw = new HtmlWeb();
    HtmlDocument doc = hw.Load(url);
    return doc.DocumentNode.OuterHtml;
}
...