Start Request использует функциональность yield.приносить в очередь запросы.Чтобы понять это полностью, прочитайте этот ответ StackOverflow.
Вот пример кода, как он работает с start_urls в методе start_request.
start_urls = [
"url1.com",
"url2.com",
]
def start_requests(self):
for u in self.start_urls:
yield scrapy.Request(u, callback=self.parse)
Для упорядочения пользовательских запросов может использоваться эта функция приоритета.
def start_requests(self):
yield scrapy.Request(self.start_urls[0], callback=self.parse)
yield scrapy.Request(self.start_urls[1], callback=self.parse, priorty=1)
та, которая имеет более высокий приоритет, будет получена первой из очереди.По умолчанию приоритет равен 0.