Я пишу автономный сценарий очистки (update.py), который реализует специальное промежуточное ПО для загрузчика.
В настоящее время сценарий использует API CrawlerProcess (), задокументированный здесь и здесь .
Это выглядит примерно так:
from scrapy.crawler import CrawlerProcess
import scrapy
class CustomMiddleware(object):
.... custom middleware definition
settings = {'LOG_LEVEL' :'INFO',
'COOKIES_ENABLED' : False,
'DOWNLOADER_MIDDLEWARES' : {
'update.CustomMiddleware': 400,
}
}
class CarvanaSpider(scrapy.Spider)
... Spider definition
process = CrawlerProcess(settings)
process.crawl(CarvanaSpider)
process.start()
Сценарий возвращает ошибку: «Нет модуля с именем« update »»
Если я заменю update.CustomMiddleware с CustomMiddleware возвращает «Неправильный путь»
Мне известно об утилите get_project_settings (), но мой сценарий не может находиться в папке проекта и должен иметь возможность работать без каких-либо дополнительных файлов.
Это достижимо ?, если так, каков наилучший способ достичь этого?