Scrapy: одно задание на паука - PullRequest
0 голосов
/ 16 мая 2019

У меня есть Scrapy проект с несколькими пауками.Как я могу запустить всех пауков со своими jobdir?В следующем коде я показываю, как я выполняю всех пауков с одним jobdir.

from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings

settings = get_project_settings()
settings.set('JOBDIR', 'saved_crawl', priority='cmdline')


process = CrawlerProcess(settings)

process.crawl('spider1')
process.crawl('spider2')
process.start()

1 Ответ

0 голосов
/ 16 мая 2019

Хорошо, я обнаружил, что решение очень простое.Мне просто нужно определить JOBDIR в пользовательских настройках, для каждого паука:

class Spider1(scrapy.Spider):
    name = 'spider1'
    custom_settings = {'JOBDIR': 'crawl_spider1'}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...