Получить все значения src изображения с веб-сайта, используя Selenium WebDriver - PullRequest
1 голос
/ 13 октября 2019

У меня есть WordPress-сайт с тысячами файлов изображений. Проблема в том, что подавляющее большинство из них являются избыточными и просто занимают место на диске. Мне нужен способ узнать, на какие из них действительно ссылается html, чтобы я мог удалить те, которые не являются.

Может быть, Selenium WebDiriver может помочь? Я мог бы очистить сайт, чтобы получить значение атрибутов src всех элементов img.

Используя следующий код, коллекция изображений заполняется 22 элементами, что является правильным для конкретной страницы. Проблема в том, что я не знаю, как получить значение атрибута "src"?

var images = driver.FindElements(By.TagName("img"));

        foreach (var image in images)
        {
            Debug.WriteLine(image.Text);
        }

Ответы [ 3 ]

1 голос
/ 13 октября 2019

GetAttribute с src получит все URL / путь к изображению.

var images = driver.FindElements(By.TagName("img"));

        foreach (var image in images)
        {
            Debug.WriteLine(image.GetAttribute("src"));
        }
1 голос
/ 13 октября 2019

Используйте GetAttribute, чтобы получить нужный вам атрибут, например:

image.GetAttribute("src")
0 голосов
/ 13 октября 2019

вы можете использовать Html Agility Pack (HAP) после получения из селена.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...