Html Agility Pack ссылка и извлечение img src - PullRequest
3 голосов
/ 08 сентября 2011

У меня есть страницы, которые используют изображения в качестве ссылок, и я пытаюсь получить ссылку href, а также src images. Проблема в том, что я собираю штраф href, но он получает только первый img src и просто повторяет.

HtmlWeb hw = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = hw.Load(url);
HtmlNodeCollection linkNodes = doc.DocumentNode.SelectNodes("//a[@href]");
foreach (HtmlNode linkNode in linkNodes)
{
HtmlAttribute link = linkNode.Attributes["href"];
HtmlNode imageNode = linkNode.SelectSingleNode("//img");
HtmlAttribute src = imageNode.Attributes["src"];

string imageLink = link.Value;
string imageUrl = src.Value;
}

Может кто-нибудь сказать мне, что не так или другой способ сделать это? Спасибо.

1 Ответ

2 голосов
/ 15 октября 2011

Попробуйте изменить

HtmlNode imageNode = linkNode.SelectSingleNode("//img");

до

HtmlNode imageNode = linkNode.SelectSingleNode(".//img");

Надеюсь, это поможет.

...