Я уже писал на прошлой неделе, мой бот всегда блокируется на странице 321.Я изменил настройки Scrapy, но заметил, что страницы между 321 и концом, похоже, не содержат элементов.
Я хотел бы знать, как пропустить страницы, приводящие к ошибкам.Я попробовал это:
next_pages = response.xpath("//div[@class='pgLightPrevNext']/a/@href").extract() #essai pour accéder au contenu des pages suivantes
for next in next_pages:
absolute_url = self.base_url + next
try:
yield scrapy.Request(absolute_url, callback=self.parse_dir_contents)
except:
pass
Но безрезультатно.Как я могу пропустить эти страницы?
Спасибо.