Образ sr c, создающий формат base64 вместо правильного URL с использованием xpath. Как мне расшифровать это, чтобы получить правильный URL? - PullRequest
0 голосов
/ 07 февраля 2020

Я извлекаю изображение с веб-сайта. Изображение имеет следующий тег:

<img src="https://www.nocibe.fr/bibliotheque/produits/NOCIBE/231330_nocibe_baume_a_levres_soyeux_tendre_coco_les_delices_baume_a_levres_soyeux_tendre_coco_9g_300x300.jpg?frz-v=2231">

Я использую следующую переменную xpath для извлечения изображения sr c:

image_url = product.xpath('.//preceding-sibling::div[@class="product-item__img"]/img/@src')

ответ, который я получил:

'IMAGE URL': 'data:image/gif;base64,R0lGODlhAQABAAAAACH5BAEKAAEALAAAAAABAAEAAAICTAEAOw=='

Мне нужен этот ответ вместо:

'IMAGE URL': 'https://www.nocibe.fr/bibliotheque/produits/NOCIBE/231330_nocibe_baume_a_levres_soyeux_tendre_coco_les_delices_baume_a_levres_soyeux_tendre_coco_9g_300x300.jpg?frz-v=2231'

Как мне добиться этого через xpath?

1 Ответ

0 голосов
/ 07 февраля 2020

На самом деле, данные загружались через Javascript. Поэтому я просмотрел источник страницы и искал URL-адрес изображения, и изображение было сохранено в:

data-frz-src="https://www.nocibe.fr/bibliotheque/produits/CLARINS/239292_clarins_milky_boost_lait_maquillant_04_milky_auburn_300x300.jpg?frz-v=2231" 

Поэтому я использовал

image_url = product.xpath('.//preceding-sibling::div[@class="product-item__img"]/img/@data-frz-src') instead of @src

Это работало как шарм! :)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...