Как извлечь URL изображения из файла HTML в C # - PullRequest
9 голосов
/ 26 апреля 2009

Может ли кто-нибудь помочь мне, объяснив, как извлечь URL изображения из файла HTML в C #

Ответы [ 2 ]

26 голосов
/ 26 апреля 2009

Пакет HTML Agility может сделать это - просто используйте запрос, например, // img, и получите доступ к src, например, так:

string html;
using (WebClient client = new WebClient()) {
    html = client.DownloadString("http://www.google.com");
}
HtmlDocument doc = new HtmlDocument();        
doc.LoadHtml(html);
foreach(HtmlNode img in doc.DocumentNode.SelectNodes("//img")) {
    Console.WriteLine(img.GetAttributeValue("src", null));
}
1 голос
/ 26 апреля 2009

Вы должны проанализировать HTML и проверить тег img, используя следующую ссылку, в которую входит библиотека C # для анализа тегов HTML. Я столкнулся с вашей проблемой b4, и я использовал эту библиотеку и хорошо работал со мной Анализ тегов HTML

...