вопрос о файлах карты сайта и их содержании для динамического сайта - PullRequest
2 голосов
/ 25 июня 2010

Я пишу набор функций для создания карты сайта для веб-сайта. Предположим, что веб-сайт - это блог.

Определение карты сайта состоит в том, что в ней перечислены страницы, доступные на веб-сайте. Для динамического сайта эти страницы меняются довольно регулярно.

На примере блога «страницы» будут постами в блоге (я предполагаю), поскольку существует ограниченное количество ссылок в карте сайта (пока игнорируем индексы карты сайта), это означает, что Я не могу продолжать добавлять список последних сообщений в блоге, потому что в какой-то момент в будущем предел будет превышен.

Я сделал два (довольно фундаментальных) предположения в вышеприведенном абзаце. Это:

Предположение 1:

Карта сайта содержит список страниц на сайте. Для динамического веб-сайта, такого как блог, страницы будут сообщениями в блоге. поэтому я могу создать карту сайта, которая просто перечисляет посты на сайте. (Для меня это звучит как подача)

Предположение 2:

поскольку существует жесткое ограничение на количество ссылок в файле карты сайта, я могу наложить некоторый произвольный предел N и просто периодически генерировать файл, чтобы вывести последние N блогов (на данном этапе это неотличимо от корма)

Мои вопросы:

  • Являются ли предположения (т.е. мое понимание того, что входит в файл карты сайта) верными / правильными?
  • То, что я описал выше, звучит очень похоже на фид, могут ли боты не просто использовать фид для индексации веб-сайта (т. Е. Необходима ли карта сайта)?
  • Если я уже генерирую файл с последними изменениями, я не вижу смысла добавлять его в файл протокола карты сайта - кто-нибудь может это объяснить?

1 Ответ

1 голос
/ 25 июня 2010

Предположение 1 верно - карта сайта действительно должна быть списком страниц на сайте - в вашем случае, да, это будут сообщения в блоге и любые другие страницы, такие как страница контактов, домашняя страница, страница о программе,и т.д., что у вас есть.

Да, это немного похоже на фид, но фид обычно содержит только самые последние элементы, в то время как на карте сайта должно быть все.

С Документы Google:

Карты сайта особенно полезны, если:

  • Ваш сайт имеет динамическое содержание.
  • На вашем сайте есть страницы, которые не 'Googlebot легко обнаруживает их во время процесса сканирования, например, страницы, содержащие расширенный формат AJAX или изображения.
  • Ваш сайт новый и на него мало ссылок.(Робот Googlebot сканирует сеть, переходя по ссылкам с одной страницы на другую, поэтому, если ваш сайт недостаточно хорошо связан, нам может быть трудно его обнаружить.)
  • Ваш сайт имеет большой архив страниц с контентом.которые плохо связаны друг с другом или вообще не связаны.

Предположение 2 немного неверно - ограничение для файла карты сайта составляет 50 000 ссылок / 10 МБ несжатого, есливы думаете, что, вероятно, достигнете этого предела, затем начните с создания файла индекса карты сайта, который ссылается только на одну карту сайта, а затем добавьте его по мере продвижения.

Google примет канал RSS в качестве карты сайтаесли это все, что у вас есть, но указывает, что они обычно содержат только самые последние ссылки - ценность наличия карты сайта заключается в том, что она должна охватывать все на сайте, а не только последние элементы, которые, вероятно, наиболее обнаруживаемы.

...