Первый пример на домашней странице делает нечто очень похожее, но учтите:
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm"); // would need doc.LoadHtml(htmlSource) if it is not a file
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
{
string href = link["href"].Value;
// store href somewhere
}
Итак, вы можете себе представить, что для img @ src просто замените каждый a
наimg
и href
с src
.Вы можете даже упростить до:
foreach(HtmlNode node in doc.DocumentElement
.SelectNodes("//a/@href | //img/@src")
{
list.Add(node.Value);
}
Для относительной обработки URL-адресов, посмотрите на класс Uri
.