У меня есть пользовательская страница 404, которая имеет 2 основные цели:
- Журнал ошибок 404, так что я могу исправить неработающие ссылки и найти злых людей, ищущих эксплойты
- Перенаправить в нужное местос 301 перемещено навсегда для страниц, которые фактически переместились
Все остальное просто перенаправлено на главную страницу.У меня проблема с ботами.Google - худший, они продолжают пытаться каждые несколько дней сканировать страницы, которые не существуют.Я даже пытался добавить страницы как запретные в мой robots.txt, но они почему-то игнорируют это.И страницы по-прежнему появляются в результатах поиска!
Я бы хотел исправить это правильно, поэтому я ищу предложения.Обратите внимание, что это платный веб-хостинг, поэтому изменение настроек веб-сервера, вероятно, не вариант.Веб-сервер работает под управлением Windows с IIS 7.
У меня возникли некоторые проблемы:
Если я обнаружу робота Google (и нескольких других основных ботов) и вручную отправлю код состояния 404, веб-сервер перехватит ловушкуэто и пытается повторно выполнить пользовательскую страницу 404, и я попадаю в бесконечный цикл.
Если у меня страница распечатывает сообщение, она отвечает кодом состояния 200.