start_urls = ['https://image.jpg']
def start_requests(self):
for url in self.start_urls:
request = scrapy.Request(url,callback=self.parse)
yield request
def parse(self, response):
item = GetImgsItem()
# print(response.url)
item['image_urls'] = response.url
yield item
Мой паук теперь может загрузить изображение с start_urls, но запрос был отправлен дважды, чтобы дать одно изображение. Как мне включить его для загрузки в start_requests?
Вопрос 2: Я создал двух пауков (паук A, паук B) в моем проекте. В пауке А у меня есть определенный c класс конвейера для обработки загруженных элементов. Теперь это работает хорошо.
Но позже, когда я использовал паук B, он также использовал тот же класс конвейера, что и паук A. Как мне установить класс конвейера, чтобы он был эксклюзивным для использования пауком A?