Google сканирует XML-файл - PullRequest
       7

Google сканирует XML-файл

0 голосов
/ 25 января 2011

Мне нужен XML-файл для индексации моего веб-сайта для сканирования Google. Я использую некоторое программное обеспечение для создания файла XML. Мой вопрос заключается в том, нужно ли мне перечислить все динамические страницы. Я имею в виду, как это:

http://mysite.com/page/?id=01
http://mysite.com/page/?id=02
http://mysite.com/page/?id=03
http://mysite.com/page/?id=04
http://mysite.com/page/?id=05

если да, то почему? и что произойдет, если я не включу их и просто скажу:

http://mysite.com/page/

Если я включу все идентификаторы, результатом будет огромный XML-файл. Google принимает этот большой файл или у него есть ограничение?

Заранее спасибо за помощь и время.

Ответы [ 3 ]

1 голос
/ 25 января 2011

Google не собирается индексировать все ваши динамические страницы в любом случае.Многие из них будут выброшены, даже если вы поместите их в sitemap.xml.Содержание будет слишком похожим.

Существует ограничение на количество записей в файле sitemap.xml. Раньше оно составляло ~ 50 тыс. Страниц / 10 МБ.По моему опыту, Google будет сканировать несколько тысяч и останавливаться, если они выглядят слишком похожими и не имеют входящих ссылок.

0 голосов
/ 25 января 2011

Если это реальная проблема, попробуйте прочитать на rel="canonical", что сделано для исключения этих типов страниц из Google. Хотя его полезность основана на сценарии использования, вы можете найти, что это правильное решение для вас.

http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=139394

0 голосов
/ 25 января 2011

Вам не нужен XML-карта сайта вообще.Google просто сканирует ваш контент.И, очевидно, вам не нужно вкладывать в это динамические вещи.

...