Question

Я пытаюсь получить URL-адрес из изображения с подделкой, но страница использует данные svg-xml для URL-адреса.В Инспекторе Chrome URL виден, но не в исходном коде.

Они используют:

Интересно, что изображение data-wa-src не совпадаетодин.

Я пытаюсь получить это основное изображение часов: Пример страницы

Andersson · Answer 1 · 05 декабря 2018

Когда вы запрашиваете главную страницу продукта, такую как https://www.brogle.de/tag-heuer/formula-1/f1-auto-smallsecond-43/#156867, ваш браузер делает еще один запрос на описание продукта для https://www.brogle.de/ajaxCached/ajax-product-details/paction/showProductAjax/puid/156867/

Обратите внимание, что идентификатор продукта (156867) является единственной динамической частьюURL описания продукта, поэтому, если вам известен URL главной страницы продукта, вы можете извлечь идентификатор продукта и отправить запрос на описание:

запросы + пример lxml.html:

import requests
from lxml import html

main_url = "https://www.brogle.de/tag-heuer/formula-1/f1-auto-smallsecond-43/#156867"
api_url = "https://www.brogle.de/ajaxCached/ajax-product-details/paction/showProductAjax/puid/"
product_id = main_url.rsplit("#")[-1]
product_description = requests.get(api_url + product_id).text
html_source = html.fromstring(product_description)
image_src = html_source.xpath('//img[@itemprop="image"]/@src')

print(image_src[0])
#  'https://www.brogle.de/tag-heuer/formula-1/automatic-small-second-43mm-waz2014.ba0842__f4e2ac9b28.png'

PS Извините, я не использую Scrapy, но я уверен, что приведенный выше код можно легко преобразовать в код Scrapy

Как получить @src с помощью xpath и scrapy, если это данные svg-xml?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как получить @src с помощью xpath и scrapy, если это данные svg-xml?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов