Я должен отметить, что , если есть желание, то есть способ .
При этом я подумал о том, что вы спрашивали ранее, и вот несколько простых вещей, которые я придумал:
Простые наивные проверки могут быть фильтрацией и проверкой пользовательского агента. Вы можете найти список распространенных пользовательских агентов для сканеров здесь: http://www.useragentstring.com/pages/Crawlerlist/
вы всегда можете отобразить ваши данные во флэш-памяти, хотя я не рекомендую это.
используйте капчу
Кроме этого, я не совсем уверен, есть ли что-нибудь еще, что вы можете сделать, но мне также было бы интересно увидеть ответы.
EDIT:
Google делает что-то интересное, когда, если вы ищете SSN, после 50-й страницы или около того, они будут напечатаны. Напрашивается вопрос, можете ли вы разумно рассчитать время, которое пользователь тратит на вашей странице, или, если вы хотите ввести разбиение на страницы в уравнении, время, которое пользователь проводит на одной странице.
Используя информацию, которую мы ранее предполагали, можно установить ограничение по времени до отправки другого HTTP-запроса. В этот момент может быть полезно «случайно» сгенерировать капчу. Под этим я подразумеваю, что, возможно, один HTTP-запрос пройдет нормально, а для следующего потребуется капча. Вы можете переключать их по своему усмотрению.