зависит от целевых пользователей ... например, Nürnberg.de также просматривает nuernberg.de , чтобы сделать его легкодоступным для родного немецкого пользователя (так как немецкая клавиатура используется по умолчанию и имеет все 4 дополнительных ключевые символы (öäüß), доступные для всех говорящих на немецком языке), и не забывайте, что одна из целей I18N - предоставить конечному пользователю ощущение родного языка. У пользователей Mac и Linux есть еще более инициативный подход, например, нажав Alt + u на Mac, вы получите умные символы, чтобы справиться с вводом I18N.
Мне просто интересно, каковы
осложнения, связанные с не-ASCII
символы в URL.
но, как вы сформулировали свой вопрос, похоже, что ваш вопрос больше касается URI, а не URL ... и вы пытаетесь объединить URN с не-ascii символами внутри URI. в этом нет никаких сложностей, если вы знаете, где и как анализировать ваш URN на сервере (например, : в случае сервера на основе Django, URN можно анализировать и обрабатывать с помощью регулярных выражений внутри url.py ) ... все, что вам нужно иметь в виду, это то, что при эволюции web2.0 (на основе Ajax javascript) все в основном выполняется в utf-8, так как спецификация Javascript требует кодировки utf-8. И, таким образом, utf-8 превратился в своего рода стандарт. придерживайтесь спецификаций кодирования utf-8, и вы вряд ли столкнетесь с какими-либо сложностями при разборе URI и обходе его.
например. проверьте URI http://de.wikipedia.org/wiki/Fürth или http://hi.wikipedia.org/wiki/जर्मनी .. независимо от того, какую кодировку вы пишете в адресной строке, браузер переведет его в UTF-8 и отправит на сервер.
ПРИМЕЧАНИЕ: кроме UTF-8, есть некоторые символы, которые кодируются с использованием процентного кодирования ... подробнее об этом можно узнать здесь ...
http://en.wikipedia.org/wiki/Percent-encoding