URL-кодировка в адресной строке браузера - PullRequest
1 голос
/ 03 июля 2011

Когда я помещаю не-буквенно-цифровые символы в адресную строку браузера, они получают URL-кодировку.Например, http://ru2.php.net/manual-lookup.php?pattern=привет превращается в http://ru2.php.net/manual-lookup.php?pattern=%EF%F0%E8%E2%E5%F2.

Вопрос: что означают эти две шестнадцатеричные цифры с префиксом?

1 Ответ

2 голосов
/ 03 июля 2011

это байты Windows 1251 кодировка кириллицы. Поскольку их всего шесть, они не могут быть UTF-8, так как для 6 символов кириллицы требуется 12 байтов UTF-8.

Кодовую таблицу для CP1251 можно найти здесь: http://en.wikipedia.org/wiki/Windows-1251.

Точно так же, как 20 - это шестнадцатеричный символ для пробела, каждый из кириллических символов имеет свое числовое значение, выражаемое в виде двух шестнадцатеричных цифр.

...