Я использую scrapy для сканирования нескольких страниц на сайте.
Переменная start_urls
используется для определения просматриваемых страниц.
Сначала я бы начал с 1-й страницы, определив таким образом start_urls = [1st page]
в файле example_spider.py
Получив больше информации с 1-й страницы, я бы определил, какие будут следующие страницы для сканирования, а затем назначил бы start_urls
соответственно. Следовательно, мне нужно переписать выше example_spider.py с изменениями в start_urls = [1st page, 2nd page, ..., Kth page]
, а затем снова запустить scrapy crawl.
Это лучший подход или есть лучший способ динамически назначать start_urls
с использованием scrapy API без необходимости перезаписывать example_splider.py
?
Спасибо.