У Google действительно есть страница о проверке адресов GoogleBot путем обратного просмотра IP-адреса и проверки того, что он идет с заданного c имени хоста (тогда вы получите IP этого адреса хост, чтобы перепроверить, он возвращается к соответствующему исходному IP).
Существуют также записи DNS TXT, которые определяют диапазоны IP для SPF (электронные письма), Google Compute Cloud и более широкие IP-адреса Google, которые могут использоваться (многие из которых будут использоваться виртуальными машинами пользователей GCP и другими службами).
dig @8.8.8.8 +short TXT _spf.google.com
dig @8.8.8.8 +short TXT _cloud-netblocks.google.com
dig @8.8.8.8 +short TXT _cloud-netblocks.googleusercontent.com
Первый запрос вернет что-то вроде этого:
"v=spf1 include:_netblocks.google.com include:_netblocks2.google.com include:_netblocks3.google.com ~all"
И затем вы проанализируете его, чтобы получить диапазоны IP-адресов, или выполните вспомогательный запрос. запрос к include:_netblocks.google.com
et c для получения других наборов.
Информация, содержащаяся в этих записях, не является фиксированной и может регулярно изменяться. (AWS публикует, например, файл. JSON с несколькими обновлениями в неделю).
Я работаю над системой автоматического обнаружения «лежащих пользовательских агентов», с этими и некоторыми другими методы.