Путаница в отношении sitemap_index.xml - PullRequest
11 голосов
/ 27 марта 2009

Я читал документы Google по форматам карты сайта, но есть одна вещь, которую они не проясняют: будут ли поисковые системы автоматически искать и находить /sitemap_index.xml или вам нужно сообщить им об этом через /robots.txt или основной файл /sitemap.xml? Можете ли вы не иметь /sitemap.xml и при этом полагаться на файл /sitemap_index.xml, который можно найти и собрать?

Ответы [ 4 ]

10 голосов
/ 27 марта 2009

В вашем файле robots.txt вы можете указать на карту сайта или файл индекса карты сайта, используя тот же синтаксис:

Sitemap: <location>

Поисковые системы узнают, глядя на файл, какой он есть.

Стоит также отметить, что sitemap.xml и sitemap_index.xml - это только рекомендуемые имена файлов, вы можете использовать любые имена, которые пожелаете. В отличие от известного местоположения robots.txt, поисковые системы не будут проверять какое-либо местоположение, например sitemap.xml или sitemap_index.xml, если вы не скажете, что в этом месте что-то есть.

6 голосов
/ 28 марта 2009

Я читал много дискуссий по этому вопросу, и никто не знает, как Google справляется с этим.

Некоторые люди говорят, что сканеры будут искать эти файлы по умолчанию:

  • / sitemap.xml
  • / sitemap.xml.gz
  • / sitemap.gz

Если вы читаете статьи из Google о xml-sitemaps, они часто говорят об этих именах файлов, это совпадение?

Возможно, это правда, но я бы предложил следовать правилам Google и использовать robots.txt + отправить карту сайта через Инструменты Google для веб-мастеров .

Я думаю, что инструменты для веб-мастеров недооценены, они стоят золота, вы можете получать информацию непосредственно от Google, информацию, которая поможет вам улучшить ваш сайт.

Если вы не хотите каждый раз заходить в инструменты для веб-мастеров, чтобы повторно отправлять карту сайта при ее обновлении, вы можете пропинговать Google, чтобы сообщить им об изменениях.

Ссылка на пинг Google: www.google.com/webmasters/tools/ping?sitemap=sitemap_url

Дополнительная информация на Служба поддержки Google .

6 голосов
/ 27 марта 2009

Лучший способ - указать карту сайта в файле robots.txt:

Sitemap: <sitemap_location>

Это довольно хорошее объяснение на www.sitemaps.org

2 голосов
/ 29 мая 2013

Я могу подтвердить, что для двух моих сайтов, которые я только что исследовал, в инструментах для веб-мастеров не было записи sitemap_index.xml или связанных с ним файлов Sitemap.

Оба сайта, которые я проверял, были проиндексированы Google более года, не упоминая карту сайта в robots.txt, и являются сайтами WordPress с автоматически созданным Yoast SEO сайтом sitemap_index.xml. Я только что добавил карты сайта вручную в инструментах для веб-мастеров.

...