Извлечение img src с помощью пакета agility HTML - PullRequest
0 голосов
/ 03 апреля 2019

Я очищаю веб-сайт (https://www.greenlee.com/us/en/elec-bender-classic-w-single-emt-shoes-555esc) с помощью HTMLAgility Pack. Я хочу получить изображение src. Однако я получаю пустой результат (?).

Вот мой код:

HtmlWeb web = new HtmlWeb();
var htmldoc = web.Load(theurl);
var htmlnode = htmldoc.DocumentNode.SelectNodes("//div[contains(@class,'thumb-sizer')");

 foreach (var item in htmlnode)
 {
    Console.WriteLine(item.InnerHtml);
 }

Теперь результат такой (также при просмотре страниц)

<img ng-src="{{image.thumbnailUrl}}" alt="{{image.title}}" title="{{image.title}}">

Но в инструментах разработчика я вижу это

<div class="thumb-sizer">
    <img ng-src="https://cdn.greenlee.com/resources/images/c039f03f-cb77- 
    4c28-9a78-af339c773365" alt="ELECTRIC BENDER CLASSIC W/SINGLE EMT 
    SHOES" title="ELECTRIC BENDER CLASSIC W/SINGLE EMT SHOES" 
    src="https://cdn.greenlee.com/resources/images/c039f03f-cb77-4c28- 
    9a78-af339c773365">
</div>

Я провел небольшое исследование, к сожалению, я не нашел обходного пути для этого. Я хочу извлечь ссылку или значение img src , но из результата InnerHtml значение src отсутствует.

...