Как обеспечить посещение различных веб-страниц человеком, а не ботом? - PullRequest
1 голос
/ 21 января 2012

как обеспечить посещение различных веб-страниц человеком, а не программой-ботом?Есть какая-нибудь техника?

спасибо

Ответы [ 3 ]

1 голос
/ 26 октября 2012
if(strstr(strtolower($_SERVER['HTTP_USER_AGENT']), "googlebot"))
{
    // Google Bot visits you
}

Это пример того, как PHP узнает, является ли посетитель GoogleBOT.

0 голосов
/ 21 января 2012

Время может быть хорошим измерением того, был ли визит человеком или ботом.

Если вы установите тайм-аут или задержку для JavaScript, который отслеживает посещение пользователя для выполнения через 1 или 2 секунды. Большинство людей посещают страницу как минимум в течение этого времени (даже если им это не нравится), тогда как бот должен уметь сканировать и двигаться в это время.

Просто мысль.

0 голосов
/ 21 января 2012

Вы можете либо изменить User Agent в заголовках HTTP, либо искать бот-подобную активность, например, очень высокую частоту обращений к широкому диапазону страниц с одного IP-адреса (хотя вы можете увидеть это сПрокси-сервер тоже).Вы также можете искать попадания в Robots.txt и предполагать, что другие посещения в том же сеансе, где также с роботом.

На самом деле не существует надежного способа сделать это, поскольку искушенные писатели-роботы могут претендовать на звание браузеров.

...