Если вы запустите crawl --record=[cache.file] [scraper]
, вы сможете использовать replay [scraper]
.
Кроме того, вы можете кэшировать все ответы с помощью HttpCacheMiddleware
, включив его в DOWNLOADER_MIDDLEWARES
:
DOWNLOADER_MIDDLEWARES = {
'scrapy.contrib.downloadermiddleware.httpcache.HttpCacheMiddleware': 300,
}
Если вы сделаете это, каждый раз, когда вы запускаете скребок, он сначала проверяет файловую систему.