это первый раз, когда я использую Scrapy Framework для python.
. Итак, я создал этот код.
# -*- coding: utf-8 -*-
import scrapy
class SpiderSpider(scrapy.Spider):
name = 'spider'
start_urls = [
'https://www.emag.ro/televizoare/c'
]
def parse(self, response):
for i in response.xpath('//div[@class="card-section-wrapper js-section-wrapper"]'):
yield {
'product-name': i.xpath('.//a[@class="product-title js-product-url"]/text()')
.extract_first().replace('\n','')
}
next_page_url = response.xpath('//a[@class="js-change-page"]/@href').extract_first()
if next_page_url is not None:
yield scrapy.Request(response.urljoin(next_page_url))
, когда я смотрю на веб-сайт, который имеет более 800 товаров. но мой сценарий занимает только первые 2 страницы почти 200 продуктов ...
Я пытался использовать css селектор и xpath, оба одинаковые ошибки.
Может кто-нибудь выяснить, где находится проблема?
Спасибо!