Консоль поиска Google не находит все файлы Sitemap в индексе Sitemap. Как исправить? - PullRequest
0 голосов
/ 26 апреля 2020

Я создал действительный индекс Sitemap (/sitemap-dec2019/sitemap_index.xml) для сайта следующим образом:

<?xml version="1.0" encoding="UTF-8"?>    
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.example.com/sitemap-dec2019/sitemap1.txt</loc>
<lastmod>2019-12-10T18:24:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>https://www.example.com/sitemap-dec2019/sitemap2.txt</loc>
<lastmod>2019-12-10T18:24:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>https://www.example.com/sitemap-dec2019/sitemap3.txt</loc>
<lastmod>2019-12-10T18:24:17+00:00</lastmod>
</sitemap>
.
.
.
<sitemap>
<loc>https://www.example.com/sitemap-dec2019/sitemap536.txt</loc>
<lastmod>2019-12-10T18:24:17+00:00</lastmod>
</sitemap>
</sitemapindex>

Каждый дочерний файл Sitemap представляет собой простой список 49 999 URL-адресов, и все они имеют размер менее 10 МБ.

Я загрузил индекс Sitemap и все дочерние файлы Sitemap на сервер. Я дважды проверил, чтобы убедиться, что индекс Sitemap и все дочерние файлы Sitemap доступны на сервере, и они доступны.

Однако, когда я отправляю индекс Sitemap в Google через консоль поиска Google, я получаю сообщение об успешном завершении: «Индекс Sitemap обработан успешно», нигде не сообщается об ошибках , и все же в нем перечислены только 9 из 106 дочерних файлов Sitemap (и все они начинаются с 'sitemap1'):

Sitemap                         Status  Discovered URLs
/sitemap-dec2019/sitemap1.txt   Success 49,999
/sitemap-dec2019/sitemap10.txt  Success 49,999
/sitemap-dec2019/sitemap100.txt Success 49,999
/sitemap-dec2019/sitemap101.txt Success 49,999
/sitemap-dec2019/sitemap102.txt Success 49,999
/sitemap-dec2019/sitemap103.txt Success 49,999
/sitemap-dec2019/sitemap104.txt Success 49,999
/sitemap-dec2019/sitemap105.txt Success 49,999
/sitemap-dec2019/sitemap106.txt Success 49,999
1-9 of 9

В индексе Sitemap нет ничего другого, что заставило бы Google выбирать только эти 9 указанных c дочерних файлов Sitemap.

В общем количестве обнаруженных URL-адресов указывается 449,991, что составляет 49 999 x 9.

Когда я удаляю файл Sitemap и повторно добавляю индекс Sitemap, в списке появляются все те же 9 дочерние файлы Sitemap, и нигде больше нигде не появляется.

Учитывая, что существует более 100 дочерних файлов Sitemap, это означает, что более 90% полностью игнорируются.

Как это исправить, чтобы все 100% сайта map Дети (и их соответствующие URL) будут обнаружены?

1 Ответ

0 голосов
/ 08 мая 2020

Все, что вы опубликовали, проверяется с точки зрения протокола, а это значит, что, скорее всего, Google здесь напортачит. Это случается, хотя, возможно, пришло время попытаться выяснить, в чем заключается их камень преткновения, и найти обходной путь. Пара идей:

Есть ли вероятность, что некоторые URL-адреса дублируются между картами сайта? Если это так, Google может предпочесть игнорировать некоторые из них.

Еще одна попытка (хотя это будет раздражать) состоит в том, чтобы разбить ее на несколько индексов карты сайта. Таким образом, вместо перечисления всех 365 файлов Sitemap в одном индексе, вы отправляете несколько файлов индекса. Технически это не должно иметь значения, но Google не совершенен, поэтому стоит поэкспериментировать с ним.

...