Я создал сканер, используя библиотеку python scrapy. Он работает отлично и надежно при работе локально. Я попытался перенести его на лямбду AWS (я его правильно упаковал). Однако, когда я запускаю его, процесс не блокируется, пока выполняется сканирование, а вместо этого завершается, прежде чем сканеры могут вернуться, не давая результатов. Вот последние строки, которые я получаю из журналов перед выходом:
2018-09-12 18:58:07 [scrapy.middleware] INFO: Enabled item pipelines:
[]
2018-09-12 18:58:07 [scrapy.core.engine] INFO: Spider opened
В то время как обычно я получаю всю информацию о просматриваемых страницах. Я пробовал спать после запуска сканирования, установки крючка и добавления его деклараторов, установки и использования этой конкретной платформы, которая, похоже, решает эту проблему, но также не работает.
Я уверен, что это проблема с Lambda, которая не учитывает блокировку соскобов, но я понятия не имею, как ее решить.