бот Google, ложные ссылки - PullRequest
1 голос
/ 30 июня 2011

У меня небольшая проблема с ботом Google, у меня есть сервер, работающий на Windows Server 2009, система под названием Workcube, и она работает на coldfusion, есть встроенный репортер ошибок, таким образом я получаю каждое сообщение об ошибке, особенноэто связано с ботом Google, который пытается перейти по ложной ссылке, которая не существует!ссылки выглядят так:

  1. http://www.bilgiteknolojileri.net/index.cfm?fuseaction=objects2.view_product_list&product_catid=282&HIERARCHY=215.005&brand_id=hoyrrolmwdgldah
  2. http://www.bilgiteknolojileri.net/index.cfm?fuseaction=objects2.view_product_list&product_catid=145&HIERARCHY=200.003&brand_id=hoyrrolmwdgldah
  3. http://www.bilgiteknolojileri.net/index.cfm?fuseaction=objects2.view_product_list&product_catid=123&HIERARCHY=110.006&brand_id=xxblpflyevlitojg
  4. http://www.bilgiteknolojileri.net/index.cfm?fuseaction=objects2.view_product_list&product_catid=1&HIERARCHY=100&brand_id=xxblpflyevlitojg

конечно с определением вроде brand_id = hoyrrolmwdgldah или brand_id = xxblpflyevlitojg - ложь, я понятия не имею, что может быть проблемой ?!нужен совет!спасибо всем за помощь!;)

1 Ответ

1 голос
/ 04 ноября 2011

Возможно, вы захотите подтвердить свой сайт с помощью Инструментов Google для веб-мастеров, которые предоставят URL-адреса, по которым будет обнаружена эта ошибка.

Ваши журналы также действительны, но вам нужно убедиться, что это действительно робот Google, попавший на ваш сайт, а не кто-то подделывает их пользовательский агент.

Вот инструкции, чтобы сделать это: http://googlewebmastercentral.blogspot.com/2006/09/how-to-verify-googlebot.html

По сути, вам нужно выполнить обратный поиск DNS, а затем прямой поиск DNS после получения хоста из обратного поиска.

Как только вы убедились, что это настоящий робот Google, вы можете приступить к устранению неполадок.,Вы видите, что робот Google не будет запрашивать URL-адреса, которые он раньше не видел, а это значит, что робот Google не должен запрашивать прямые ссылки на объекты.Я подозреваю, что это мошеннический бот с пользовательским агентом Googlebot, но если это не так, вы можете просмотреть свой сайт, чтобы убедиться, что вы случайно не ссылаетесь на эти страницы.

К сожалению, вы опубликовали полные URL-адреса, поэтому даже если вы очистите свой сайт, Googelbot увидит ссылки из переполнения стека и продолжит сканировать их, потому что он будет в их очереди сканирования.

Я бы предложил 301 перенаправить эти URL-адреса туда, где есть смысл для ваших пользователей.В противном случае я бы 404 или 410 этих страниц, чтобы Google знал, чтобы удалить эти страницы из их индекса.

Кроме того, если эти страницы вы не хотите индексировать, я бы предложил добавить путь к вашему robots.txtфайл, поэтому робот Googlebot не может продолжать запрашивать больше этих страниц.

К сожалению, по-настоящему хорошего способа сказать роботу Google никогда больше не сканировать эти URL-адреса.Вы всегда можете зайти в Инструменты Google для веб-мастеров и потребовать удаления URL-адресов из их индекса, что может помешать роботу Googlebot сканировать их снова, но это не гарантирует этого.

...