Scrapy - проблема с выводом из xpath / css - PullRequest
0 голосов
/ 06 марта 2020

Вот пример ссылки, которую я собираю: https://www.homedepot.com/p/ZLINE-Kitchen-and-Bath-ZLINE-30-in-Wooden-Wall-Mount-Range-Hood-in-Walnut-Includes-Remote-Motor-KBRR-RS-30/311456581?MERCH=REC-_-rv_gm_pip_rr-_-303727628-_-311456581-_-N

enter image description here

Я пытаюсь получить инте rnet число, и я попробовал и css и xpaths

Вот то, что я пробовал

productOMS = product.xpath("//span[@id='product_ID']").getall()

или

productOMS = product.css(".product_internet_number::text").getall()

и вот фрагмент html, который я пытаюсь очистить:

<span itemprop="productID" id="product_internet_number" class="" style="" xpath="1">311456581</span>

Я также использовал расширение селектора xpath на chrome, которое дало мне

enter image description here

когда я использую CSS у меня возвращается пустое поле, а когда я использую xpath, я получаю что-то вроде:

" 312028174"

Буду признателен за любую помощь!

1 Ответ

1 голос
/ 06 марта 2020

попробуйте

response.xpath("//span[@id='product_internet_number']/text()").extract()

, если вы выполняете подпункт выбора с именем product из объекта ответа, тогда:

product.xpath(".//span[@id='product_internet_number']/text()").extract()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...