Я пытаюсь отсканировать страницу, которая по какой-либо причине перенаправляет скрап, через 301 на английскую версию, а затем сайт анализируется, чего не следует делать, поскольку правила явно исключают URL.
При поискеРешение о том, как остановить любое перенаправление, я нашел следующий код:
meta ={'dont_redirect': True}
К сожалению, это не имеет никакого эффекта.Мой класс пауков выглядит следующим образом:
class GetbidSpider(CrawlSpider):
name = 'test'
meta ={'dont_redirect': True}
allowed_domains = ['www.example.de']
start_urls = ['https://www.example.url/bla.html']
rules = (
Rule(
LinkExtractor(allow=['.*Mein-String.*[a-z]::[0-9].*']),
callback='parse_item'
),
Rule(
LinkExtractor(allow=['^.*de\/((?!My-String|:_:|productListingStyle|\.php).)*$']),
follow=True
),
)
Это правильное место для настройки перенаправления и почему Scrap анализирует ввод, пока первое правило URL не будет выполнено?