Есть два типа гусеничных
1. Сканер без рендеринга, который может запрашивать контент вашего сайта без использования каких-либо других технологий, таких как CSS, Javascript и, конечно, он без рендеринга.
2. Отрендеренный сканер, который может работать точно так же, как большинство браузеров, которые вы используете
Чтобы запретить все сканеры, вы можете разместить на своем сайте капчу, и это раздражает. Но чтобы разрешить определенный сканер, вы можете поместить небольшой сценарий для мониторинга и предотвратить плохой сканер, как эти следующие факторы:
1. Агент браузера
2. Сколько страниц IP-адрес может просматривать ваш сайт за период времени
3. Проверьте, может ли пользователь выполнять JavaScript (не рекомендуется, потому что Google может также использовать сканер без рендеринга)