Файлы, которые вы не включаете (или исключаете) в свой sitemap.xml
, также могут быть проиндексированы, если их robotx.txt
позволяет роботам Google с атрибутом index
или если ссылки с других страниц на страницу имеют follow
атрибут.
Что касается вашего вопроса, плагин позволяет вам добавить массив exclude
страниц, которые не будут добавлены в ваш sitemap.xml
, несмотря на то, что они были получены вашим запросом. Итак, в вашем gatsby-config.js
:
{
resolve: `gatsby-plugin-advanced-sitemap`,
options: {
query: `{}`, // your query
mapping: {}, // add if needed
exclude: [
`/dev-404-page`,
`/404`,
`/404.html`,
`/offline-plugin-app-shell-fallback`,
`/terms-and-conditions`,
`/terms-of-use`,
`/cookie-policy`,
`/privacy-policy`,
/(\/)?hash-\S*/,
],
createLinkInHead: true,
addUncaughtPages: true,
additionalSitemaps: [], // add if needed
},
},
В идеале ваши исключенные страницы могут следовать способу регулярного выражения, чтобы автоматически исключаться при создании. Однако, если нет, как показано в приведенном выше коде, вы можете добавить вручную. В этом случае ни /terms-of-use
, /cookie-policy
, ни /privacy-policy
не будут добавлены в ваш sitemap.xml
.