Selenium ver 3.141. Chrome драйвер, Windows 10
Здравствуйте, цель состоит в том, чтобы извлечь значение свойства HTML DOM, в частности, id, href и data-download-file-url для каждого из изображений, отображаемых из этот веб-сайт (Этот сайт предназначен исключительно для образовательных целей). Хотя существует другой подход, который можно применить для извлечения всех этих элементов, но в настоящее время я использую подход find_elements_by_xpath
. Тем не менее, я приветствую, если кто-то хотел бы предложить более эффективный подход, о котором я не знаю.
На вышеупомянутом веб-сайте Xpath к целевому элементу равен
/html/body/main/section[2]/div/div/figure[X]/div
с большой буквы X обозначает метку изображения, которая принимает значение от 1 до 50, для вышеупомянутого веб-сайта. Каждая фигура подпадает под класс showcase__content
.
Я пробовал следующие строки
titles_element = browser.find_elements_by_xpath("//div[@class='showcase__content']/a")
# List Comprehension to get the actual repo titles and not the selenium objects.
titles = [x.text for x in titles_element]
Однако в titles_element
свойства dom не извлекаются. Следовательно, titles
производят []
.
Я испытываю желание попробовать также следующее, но вместо этого это дает мне ошибку
titles_element = browser.find_elements_by_xpath("//figure[1]/div[@class='showcase__content']//@data-download-file-url")
Я действительно ценю, если кто-то может пролить свет на это problem.
Пример свойства DOM для рисунка 1. Все свойства имеют розовый цвет. https://drive.google.com/open?id=190q615C3uXLZUQNI8K4AJYL3Slii1ktO