Как запретить Googlebot перегружать сайт? - PullRequest
10 голосов
/ 25 августа 2009

Я управляю сайтом с большим количеством контента, но небольшим трафиком, на выделенном сервере в середине пути.

Иногда Googlebot пугает нас, в результате чего Apache максимально использует свою память и приводит к сбою сервера.

Как мне этого избежать?

Ответы [ 6 ]

9 голосов
/ 25 августа 2009

Вы можете настроить сканирование своего сайта с помощью инструментов Google для веб-мастеров. В частности, посмотрите на эту страницу: Изменение скорости сканирования Google

Вы также можете ограничить страницы, которые ищет робот Google, используя файл robots.txt. Существует настройка, доступная для crawl-delay, но, похоже, она не соблюдается от Google.

8 голосов
/ 25 августа 2009
  • Зарегистрируйтесь в инструментах Google для веб-мастеров, подтвердите свой сайт и отключите бот Google
  • отправить карту сайта
  • прочитайте google guildelines: (if-Modified-Since HTTP header)
  • используйте robot.txt , чтобы ограничить доступ бота к некоторым частям сайта
  • создайте скрипт, который изменяет robot.txt каждый $ [период времени], чтобы убедиться, что бот никогда не сможет сканировать слишком много страниц одновременно, и при этом убедиться, что он может сканировать весь контент в целом
1 голос
/ 15 октября 2014

Обратите внимание, что вы можете установить скорость сканирования с помощью Инструментов Google для веб-мастеров (в разделе "Настройки сайта"), но они действуют только в течение шести месяцев! Таким образом, вы должны войти в систему каждые шесть месяцев, чтобы установить его снова.

Этот параметр был изменен в Google. Настройка сохраняется только в течение 90 дней (3 месяца, а не 6).

1 голос
/ 25 августа 2009

Зарегистрируйте свой сайт с помощью Инструментов Google для веб-мастеров, которые позволяют указать, как часто и сколько запросов в секунду робот Google должен пытаться проиндексировать на вашем сайте. Инструменты Google для веб-мастеров также могут помочь вам создать файл robots.txt, чтобы уменьшить нагрузку на ваш сайт

0 голосов
/ 29 января 2019

Чтобы ограничить скорость сканирования:

  • На домашней странице консоли поиска выберите нужный сайт.

  • Щелкните значок шестеренки «Настройки», затем нажмите «Настройки сайта».

  • В разделе Скорость сканирования выберите нужный параметр, а затем ограничьте требуемую скорость сканирования.

Новая скорость сканирования будет действительна в течение 90 дней.

0 голосов
/ 25 августа 2009

Вы можете настроить скорость сканирования в инструментах Google для веб-мастеров.

...