У меня есть URL, который содержит специальные символы. Например:
http://www.example.com/bléèàû.html
Если вы введете этот URL в браузере, мой веб-сервер отобразит правильную страницу (он может обрабатывать специальные символы).
Я посмотрел спецификации sitemaps , и не ясно, может ли файл sitemaps содержать специальный символ. Из того, что я понимаю о протоколе, если URL работает нормально, а сервер обслуживает правильную страницу, а файл XML имеет кодировку UTF-8, тогда все в порядке.
Например, эта запись является допустимой записью карты сайта:
<url>
<loc>http://www.example.com/bléèàû.html</loc>
<changefreq>weekly</changefreq>
</url>
Кто-нибудь может подтвердить это?
[Обновить] Причина, по которой я не хочу кодировать специальные символы, заключается в том, что я не хочу вводить повторяющиеся URL-адреса для одного и того же содержимого. Например
http://www.example.com/bl%C3%A9%C3%A8%C3%A0%C3%BB.html
и
http://www.example.com/bléèàû.html
будет обслуживать ту же страницу. Я предполагаю, что Google поймал бы и URL с его нормальной индексацией и карты сайта. К сожалению, Google имеет тенденцию понижать рейтинг страниц на сайтах с дублирующимися URL-адресами, указывающими на одну и ту же страницу.