распечатать исходный веб-сайт из HtmlAgilityPack - PullRequest
1 голос
/ 17 марта 2012

Я новичок в C # из фона Python. Мне было трудно понять это. В Python я могу использовать Beautifulsoup, чтобы сделать это:

from bs4 import BeautifulSoup
import requests
r = requests.get('http://stackoverflow.com').content
soup = BeautifulSoup(r).prettify
print soup

Получает исходное содержимое stackoverflow.com и выводит его на консоль. Я не могу понять, как это сделать в C #.

        var webGet = new HtmlWeb();
        var document = webGet.Load("http://stackoverflow.com");
        Console.WriteLine(document);

Это не работает, только печатает тип документа var. Кто-нибудь знает как это сделать? Это было бы очень ценно - я пытаюсь выучить C #, конвертируя одну из моих программ на python, просто к вашему сведению.

1 Ответ

4 голосов
/ 17 марта 2012

Используйте OuterHtml свойство DocumentNode:

var webGet = new HtmlWeb();
var document = webGet.Load("http://stackoverflow.com");
Console.WriteLine(document.DocumentNode.OuterHtml);
...