Если действительно, что Википедия использует китайские символы (и другие символы Юникода) в URL - PullRequest
1 голос
/ 06 июня 2019

В Википедии вы видите такие URL:

Во-первых, мне интересно, что здесь происходит, как называется преобразование кодировки и что он делает и почему он это делает. Я не понимаю, почему в URL нельзя просто добавить оригинальные нативные символы.

Во-вторых, мне интересно, считается ли действительным то, что делает Википедия. Если можно включить эти глифы, не относящиеся к ASCII, в URL, и если нет, то почему бы и нет (кроме случаев, когда в стандарте так сказано). Также было бы интересно узнать, сколько браузеров поддерживают отображение ссылки в строке URL с использованием собственных глифов и этой закодированной вещи, и даже было бы интересно узнать, как это делается на родном китайском / тайском / и т.д. люди вводят URL-адрес на своем языке, если они используют кодировку или что-то (но это, вероятно, делает этот вопрос слишком сложным; все равно это будет интересный бонус).

Причина, по которой я спрашиваю, состоит в том, что я хотел бы поместить, скажем, слова / определения нескольких разных языков на веб-страницу, и я хотел бы, чтобы URL отображал фактическое слово, используемое в языке. Так что в английском это может быть /hello, но эквивалентное слово / определение в тайском будет /สวัสดี. Это имеет для меня гораздо больше смысла, чем превращение в кодировку.

1 Ответ

1 голос
/ 06 июня 2019

С https://en.wikipedia.org/wiki/Uniform_Resource_Identifier

Строки октетов данных в URI представлены в виде символов. * Разрешенные символы в URI - это символы ASCII для строчных и прописных букв современного английского алфавита, арабских цифр, дефиса, точки, подчеркивания и тильды. [14] Октеты, представленные любым другим символом, должны кодироваться в процентах.

Не все символы Юникода могут использоваться в URI. Символы, которые не поддерживаются, все еще могут быть закодированы с использованием Percent Encoding . Вы можете видеть не-ascii символы в поле URL, потому что ваш браузер выбирает их таким образом, фактические HTTP-запросы выполняются с использованием закодированных строк.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...