Следуйте по ссылкам перенаправления в scrapy - PullRequest
7 голосов
/ 15 апреля 2011

Как я могу установить это?я написал handle_httpstatus_list = [301, 302, 303], но scrapy не следует новым ссылкам, он только начал сохранять пустые файлы страниц.

PS Английский не мой родной язык.Извините меня за это.

Ответы [ 2 ]

5 голосов
/ 04 июля 2012

Scrapy обрабатывает перенаправления по умолчанию, это означает, что RedirectMiddleware активируется в настройке DOWNLOADER_MIDDLEWARES, а для настройки REDIRECT_ENABLED установлено значение True.

5 голосов
/ 21 июня 2011

Вам также нужно будет указать dont_redirect = true в своем запросе как:

meta = {'dont_redirect': True, "handle_httpstatus_list" : [301, 302, 303]}

Привет

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...