Обработка национальных знаков, таких как ą ę в URL? - ваш вариант - PullRequest
2 голосов
/ 30 ноября 2008

как вы справляетесь с ними?

Ответы [ 4 ]

2 голосов
/ 30 ноября 2008

В доменных именах вы можете использовать домены IDN, если они поддерживаются регистраторами, с которыми вы хотите их зарегистрировать.

В других местах URL они обычно отправляются браузером как utf8 urlencoded. Только недавно я смотрел на:

http://en.wikipedia.org/wiki/Pfeffern%C3%BCsse

И было любопытно, что в URL была буква ü. Firefox показывает это как правильный символ.

1 голос
/ 30 ноября 2008

Возможно, вы захотите взглянуть на RFC 3986 Унифицированный указатель ресурса: общий синтаксис. Это определяет, как обрабатывать не-ASCII символы в URL. Общая идея состоит в том, чтобы кодировать UTF-8 каждый символ, преобразовывать каждый результирующий байт в шестнадцатеричное значение из двух цифр и добавлять «%».

Конечно, любой вариант - просто убрать их из URL или заменить на что-то вроде подчеркивания, это зависит от ваших требований.

1 голос
/ 30 ноября 2008

Вы захотите взглянуть на IDNA и Punycode , которые являются стандартами, которые обрабатывают это в доменных именах.

0 голосов
/ 30 ноября 2008

Проблема с этими именами в том, что их легко спутать с другими персонажами. Поэтому мне нужна очень веская причина, чтобы использовать их. Например, если название вашей компании - «Шредер», я бы использовал и schröder.com, schroder.com, и даже schroeder.com, дополнительные расходы оправданы, поскольку просто создать вредоносное имя просто.

...