Есть ли способ игнорировать коды ошибок 4xx при повторном сканировании домена, который частично находится в кеше?
Я просканировал огромную часть страницы перед тем, как столкнуться с проблемами, затем я изменил настройки, чтобы они не кэшировалисьКодов 4xx, потому что сканер остановил
Crawled (403) <GET https:/... ['cached']:
Изменен параметр кэширования на: HTTPCACHE_IGNORE_HTTP_CODES = [401, 403, 404]
Это, к сожалению, вынуждает меня пересматривать страницу без кэша, так какТеперь я получаю эту информацию из журналов:
ИНФОРМАЦИЯ: Игнорирование ответа <403 <a href="https://www" rel="nofollow noreferrer">https://www...>: Код состояния HTTP не обрабатывается или не разрешается.
ЛибоКстати, сканер останавливается в той же позиции, в которой он извлекает кэшированные коды ответов 403, в то время как теперь они не из кэша 200.
Как я могу адаптировать настройки, чтобы продолжить сканирование страницы?
Или, как альтернатива, как можно очистить / сохранить кэш?Потому что в противном случае мне нужно было бы переопределить без настройки кэша, насколько я понимаю, документы.