c # HtmlAgility Pack - Невозможно получить изображение src - PullRequest
0 голосов
/ 14 июля 2011

Я пытаюсь узнать, как получить все img src из URL.Но переменная imgs в моем коде всегда равна null.Что я делаю не так?

static void Main(string[] args)
{
    HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
    doc.LoadHtml("http://archive.ncsa.illinois.edu/primer.html");
    HtmlAgilityPack.HtmlNodeCollection imgs = doc.DocumentNode.SelectNodes("//img");

    if (imgs != null)
    {
        foreach (HtmlAgilityPack.HtmlNode img in imgs)
        {
            string imgSrc = img.Attributes["src"].Value;
        }
    }

    Console.ReadKey();
}  

1 Ответ

3 голосов
/ 14 июля 2011

Вы используете HtmlDocument.LoadHtml, который предназначен для получения исходного html, а не URL.

Вы можете использовать WebClient для получения html, например:

WebClient wc = new WebClient();
string html = wc.DownloadString("http://archive.ncsa.illinois.edu/primer.html");
doc.LoadHtml(html);

HtmlDocument также поддерживаетЗагрузка, позволяющая загружать контент из других источников.

...