Если вы заинтересованы только в хорошо настроенных авторитетных ботах, например Google, Yahoo, MSN / Live / Bing / все, что сегодня, спросите и т. Д., Затем вы можете использовать проверку DNS в обе стороны.
1) Проверка известного пользовательского агента (ищите известную подстроку, такую как googlebot)
например Mozilla / 5.0 (совместимо; Googlebot / 2.1; + http://www.google.com/bot.html
2) Сделайте обратный DNS для запрашивающего IP и проверьте, что он приходит из разумного домена.
например rdns из 66.249.71.202 - crawl-66-249-71-202.googlebot.com (так счастлив, что он исходит от googlebot.com)
3) Сам по себе шаг 2 может быть подделан, поэтому теперь проверьте днс записи A для результата, возвращенного на шаге 2, и убедитесь, что у вас есть исходный запрашивающий IP.
например днс для выше это
crawl-66-249-71-202.googlebot.com. A 66.249.71.202
66.249.71.202 был запрашивающий IP-адрес, так что это действительный робот Google.