скрап не возвращает текст, который я ищу - PullRequest
0 голосов
/ 23 апреля 2020

Всего новичков ie и извините заранее, если я не должен публиковать это здесь ... но здесь мы go. Просто хотел попробовать что-то новое и попробовать отказаться от названия продукта и цен с этого сайта. Нужна помощь в том, почему я получаю несколько названий и почему я не могу заставить цену работать на меня.

# -*- coding: utf-8 -*-
import scrapy


    class SpidervenderSpider(scrapy.Spider):
        name = 'spidervender'
        allowed_domains = ['www.woolworths.com.au/shop/productdetails/306165/red-bull-energy-drink']
        start_urls = ['https://www.woolworths.com.au/shop/productdetails/306165/red-bull-energy-drink']

        def parse(self, response):

            redbulls = response.xpath('//div')

            for redbull in redbulls:
                title = redbull.xpath('.//h1[@class="shelfProductTile-title heading3"]/text()').extract_first()
                price = redbull.xpath('.//shared-price/div/span[@class="price-dollars"]').extract_first()
                if title is not None:
                    print(title)
                print(price)

1 Ответ

0 голосов
/ 23 апреля 2020

Вы получаете несколько названий, потому что вы вставили в -l oop. Я попытался извлечь цену, и я также получил ошибки. Как подсказка, лучше использовать отчет о доходности. Извлечение цены будет немного сложнее. 11 и 25 центов находятся в разных классах, поэтому вы должны очистить их отдельно.

Redbull

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...