Я могу подтвердить, что Google не уважает файл исключения роботов.Вот мой файл, который я создал до размещения этого источника в Интернете:
https://git.habd.as/robots.txt
И полное содержимое файла:
User-agent: *
Disallow:
User-agent: Google
Disallow: /
И Google все еще проиндексировал его.
Я не пользуюсь Google после закрытия своей учетной записи в марте прошлого года, и этот сайт никогда не добавлялся в консоль для веб-мастеров за пределами Яндекса, что оставляет мне два предположения:
- Google не работаетЯндекс
- Google не соблюдает стандарт исключения роботов
Я еще не просмотрел свои журналы, но я сделаю это, и я предполагаю, что я найду там пауков Google, которые плохо себя ведут.