Проблема кодирования URL с китайским языком - PullRequest
3 голосов
/ 25 сентября 2011

У меня есть такой текст на китайском языке: «回家» - по-английски это «house».

Я захожу на google.com, отправляю "回家" в поиске и получаю такой URL:

http://www.google.ru/ ... q =% E5% 9B% 9E% E5% AE% B6

=> q =% E5% 9B% 9E% E5% AE% B6

Затем я иду на taobao.com пост ""家", чтобы искать и получить URL-адрес, как это: http://search8.taobao.com/search?q=%BB%D8%BC%D2

=> q =% BB% D8% BC BC D2

Почему кодировка URL не совпадает? Какая кодировка используется на таобао?

1 Ответ

4 голосов
/ 25 сентября 2011

Последовательность байтов для "回家" в кодировке UTF-8 равна E5 9B 9E E5 AE B6, последовательность байтов в кодировке GB 18030 равна BB D8 BC D2.Google использует UTF-8, Taobao использует GB 18030.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...