Question

Я хочу очистить информацию от нескольких URL.Я использую следующий код, но он не работает.Может кто-нибудь, пожалуйста, указывает мне, где я ошибся?

import scrapy


class spider1(scrapy.Spider):
    name = "spider1"
    domain = "http://www.amazon.com/dp/"
    ASIN = ['B01LA6171I', 'B00OUKHTLO', 'B00B7LUVZK']

    def start_request(self):
        for i in ASIN:
            yield scrapy.Request(url=domain+i, callback=self.parse)

    def parse(self, response):
        title = response.css("span#productTitle::text").extract_first().strip()
        ASIN_ext = response.xpath("//input[@name='ASIN']/@value").extract_first()
        data = {"ASIN": ASIN_ext, "title": title, }
        yield data

stasdeep · Answer 1 · 24 июня 2019

У вас есть опечатка в имени метода: она должна быть start_requests вместо start_request.

несколько URL-адресов с использованием цикла for в scrapy

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

несколько URL-адресов с использованием цикла for в scrapy

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы