Selenium Python: как получить CSS без целевого класса / ID / тега - PullRequest
0 голосов
/ 28 сентября 2018

Я работаю над проектом скребка, и одна из целей состоит в том, чтобы получить ссылку на каждое изображение из HTML и CSS веб-сайта.Я использовал BeautifulSoup & TinyCSS, чтобы сделать это, но теперь я хотел бы переключить все на Selenium, поскольку я могу загрузить JS.

Я не могу найти в документе способ нацеливания на некоторые параметры CSS, не имеязнать тег / идентификатор / класс.Я легко могу получить изображения из HTML, но мне нужно настроить таргетинг на каждый параметр «background-image» из CSS, чтобы получить URL из него.

ex: background-image: url ("paper.gif");

Есть ли способ сделать это или я должен перейти к каждому элементу и проверить соответствующий CSS (который будетотнимающие много времени)?

1 Ответ

0 голосов
/ 28 сентября 2018

Вы можете получить все теги стиля и проанализировать их, выполнив поиск по тому, что вы ищете.

Также вы можете скачать файл css, используя URL ресурса, и проанализировать их.

Также вы можетесоздайте правило XPATH / CSS для поиска узлов, которые содержат искомый параметр.

...