не подпускайте веб-сканеров к вашему сайту - PullRequest
2 голосов
/ 27 августа 2010

Есть ли способ в веб-разработке, чтобы веб-сканеры не могли сканировать ваш сайт?

Ответы [ 4 ]

3 голосов
/ 27 августа 2010

Убедитесь, что? Нет.

Вы можете вежливо спросить с помощью robots.txt (но их можно игнорировать), вы можете закрепить барьеры с помощью CAPTCHA (но они могут быть побеждены и наложить барьер для обычных пользователи), и вы можете отслеживать поведение каждого посетителя, ищущего шаблоны ботов (но боты могут использовать прокси-цикл и ограничение скорости).

1 голос
/ 27 августа 2010

Вы также можете запретить доступ на основе сканеров пользовательский агент , конечно, это предполагает, что сканер использует пользовательский агент, отличный от обычного браузера.

1 голос
/ 27 августа 2010

Вы можете разместить файл robots.txt со следующим содержимым в корне вашего сайта, что предотвратит его индексацию цивилизованными роботами:

User-agent: *
Disallow: /

Обратите внимание, что это победилоне помешают нецивилизованным роботам проиндексировать его.Единственный способ предотвратить их - использовать такие методы, как Captcha.

Конечно, предпочтительно использовать специальную машину для разработки, которая недоступна из Интернета, пока ваш сайт находится в стадии разработки.

0 голосов
/ 27 августа 2010

Используйте файл robots.txt, чтобы разрешить или запретить / запретить роботам индексировать ваш сайт.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...