Использование Scrapy не в состоянии получить child xpath из родительского div - PullRequest
0 голосов
/ 19 апреля 2019

При попытке извлечь дочерний div внутри div [есть 28 родительских div], xpath не выполняет итерацию.

Возможность получить каждого родительского div

product_divs=scrap_product_detail_response.xpath("//div[contains(@class,'s-expand-height s-include-content-margin s-border-bottom')]")
print(len(product_divs))
for product_div in product_divs:
    img_urls=product_div.xpath("//span[contains(@class,'a-size-base-plus a-color-base a-text-normal')]//text()").extract()
    print(img_urls)

В настоящее время вывод становится 1.jpg 1.jpg 1.jpg

Ожидаемое: 1.jpg 2.jpg 3.jpg

1 Ответ

1 голос
/ 20 апреля 2019
product_divs=scrap_product_detail_response.xpath("//div[contains(@class,'s-expand-height s-include-content-margin s-border-bottom')]")
print(len(product_divs))
for product_div in product_divs:
    img_urls=product_div.xpath(".//span[contains(@class,'a-size-base-plus a-color-base a-text-normal')]//text()").extract()
    print(img_urls)

Вы написали все правильно, но вы оставили эту (точку) относительного xpath

...