Канонические метки и UTF8 - PullRequest
       16

Канонические метки и UTF8

4 голосов
/ 24 ноября 2010

Будут ли следующие 2 тега канонических ссылок рассматриваться пауками как указывающие на тот же URL?

<link rel="canonical" href="http://www.example.com/&#375;" /> - в кодировке
<link rel="canonical" href="http://www.example.com/ŷ" /> - без кодировки

Ответы [ 4 ]

3 голосов
/ 24 ноября 2010

&#375; - это HTML-объект, представляющий символ Unicode с кодовой точкой 375 в десятичной записи.В шестнадцатеричном виде это будет 0x177, поэтому мы говорим о U + 0177, который равен ŷ.

Это означает, что оба URL одинаковы, если:

  1. Они отображаются в контексте документа HTML.
  2. Документобъявляет правильный набор символов, который поддерживает такой символ, и редактор, который вы использовали для его ввода, вставил правильный код.

Если браузер отображает ŷ, в обоих случаях вероятно, что набор символов правильный, но вы должны сделатьконечно, это так.

1 голос
/ 24 ноября 2010

если вы сообщаете свой HTML как UTF-8, URL-адрес будет выглядеть так же.

1 голос
/ 24 ноября 2010

Даже если вы ожидаете, что он будет работать в современных браузерах, http://www.example.com/ŷ является недействительным URL-адресом .

Вы всегда должны кодировать символы Юникода в процентах.

1 голос
/ 24 ноября 2010

Не уверен на 100%, но я думаю, что они оба будут указывать на один и тот же URL.Но имейте в виду, что, глядя на стандарты W3, они часто предлагают кодировать ссылки.

...