Почему невозможно очистить некоторые сайты? - PullRequest
0 голосов
/ 19 октября 2018

В настоящее время я учусь очищать веб-сайты с помощью Python / BeautifulSoup, и мне интересно знать, почему некоторые страницы могут быть удалены, а другие нет.

Например:

Есть ли на некоторых страницах какая-либо защита, предотвращающая очистку?

1 Ответ

0 голосов
/ 19 октября 2018

Первое, что я бы попытался сделать, чтобы протестировать определенную веб-страницу, если она может быть очищена или нет, - это запустить ее с scrapy shell, затем я посмотрю ответ обратно view(response), поэтому все, что возвращается вэтот ответ можно отменить.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...