Этот вопрос - отличное место для начала: Обнаружение веб-сканеров 'stealth'
Исходное сообщение:
Для разработки решения потребуется немного времени.
Я могу сразу подумать о трех вещах, которые нужно искать:
Один, пользовательский агент.Если паук google или bing или что-то еще, он идентифицирует себя.
Два, если паук злонамеренный, он, скорее всего, будет эмулировать заголовки обычного браузера.Отпечатайте его, если это IE.Используйте JavaScript, чтобы проверить наличие активного объекта X.
Три, обратите внимание на то, к чему он обращается и как часто.Если на просмотр контента уходит среднее количество человеко-секунд, то вы можете использовать его как место для начала, пытаясь определить, возможно ли по-человечески быстро использовать данные.Это сложно, вам, скорее всего, придется полагаться на куки.IP-адрес может быть доступен нескольким пользователям.