Я зафиксировал запрос гусеничного робота в своем приложении asp.net, и вот как выглядит подпись гусеничного сканера.
Запрашивающий IP : 66.249.71.113
Клиент : Mozilla / 5.0 (совместимо; Googlebot / 2.1; + http://www.google.com/bot.html)
В моих журналах наблюдается много разных IP-адресов для сканера Google в 66.249.71.*
диапазон. Все эти IP-адреса географически расположены в Маунтин-Вью, Калифорния, США.
Хорошим решением для проверки того, поступает ли запрос от Google Crawler, было бы подтверждение того, что запрос содержит Googlebot
и * 1019.*. Как я уже сказал, с одним и тем же запрашивающим клиентом наблюдается множество IP-адресов, я бы не рекомендовал проверять IP-адреса. И, возможно, именно здесь на снимке указывается личность клиента. Так что пойдите для проверки личности клиента.
Вот пример кода на C #.
if (Request.UserAgent.ToLower().Contains("googlebot") ||
Request.UserAgent.ToLower().Contains("google.com/bot.html"))
{
//Yes, it's google bot.
}
else
{
//No, it's something else.
}
Важно отметить, что любой Http-клиент может легко подделать это.