Я пытаюсь очистить списки продуктов MercadoLibre.Я использую Scrapy 1.5.0.Когда Scrapy пытается перейти на следующую страницу, она перебирает первую и вторую страницы.
Код
# Python 3.5
# Scrapy 1.5.0
import scrapy
from scrapy.http import Request
class MercadoLibreSpider(scrapy.Spider):
name = "mlspider"
allowed_domains = ['mercadolibre.com.ar']
start_urls = ['https://listado.mercadolibre.com.ar/microondas#D[A:microondas]']
def parse(self, response):
# Prices
priceData = response.css(".price__fraction::text").extract()
# Product Listings
titleData = response.css(".main-title::text").extract()
for i in range(len(priceData)):
yield {
'title':titleData[i],
'price':priceData[i]
}
# Pagina siguiente
nextPage = response.css('.andes-pagination__link::attr(href)').extract_first()
if nextPage is not None:
yield Request(url=nextPage, callback=self.parse)