Question

Я пытаюсь отсканировать веб-сайт для обуви для университетского проекта. Из кода ниже я получаю 3-4 ботинка, но после этого для остальных ботинок я получаю ответ «Пожалуйста, включите куки», хотя я установил Cookies_enabled=True и Cookies_debug=True. В чем проблема?

import scrapy
from scrapy.http import Request


class FirespiderSpider(scrapy.Spider):
    name = 'firespider'
    page_number = 2
    allowed_domains = ['kicksonfire.com']
    start_urls = ['https://www.kicksonfire.com/app/upcoming?page=1']

    def parse(self, response):
        shoe_links = response.xpath ('//div/a/@href').extract()[1:None]
        for link in shoe_links:
            yield scrapy.Request(link, callback=self.parse_page, dont_filter=True)


    def parse_page(self, response):
        shoe_name = response.xpath('//div/h2/text()').extract()[0].strip()
        print('Schuh:' + shoe_name)

Первая часть журнала Ответ «Пожалуйста, включите куки» в журнале

Scrapy - Как исправить «Пожалуйста, включите куки», когда куки уже включены?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Scrapy - Как исправить «Пожалуйста, включите куки», когда куки уже включены?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы