Как мне отформатировать URL со специальными / международными символами?
В настоящее время я стараюсь, чтобы URL выглядели хорошо, чтобы:
www.myhost.com/this is a test, do you know how?
преобразуется в:
www.myhost.com/this_is_a_test_do_you_know_how
Я знаю, что некоторые международные буквы могут быть преобразованы (ü = ue, æ = ae, å = aa), некоторые символы могут быть удалены. Обычно я пытаюсь сделать так, чтобы URL выглядел «хорошо», но разве это глупо?
Но что мне делать с китайскими, японскими и арабскими буквами, которые не имеют ничего общего с нашим западным форматом ASCII?
Мне действительно не нравится идея перезаписи URL шестнадцатеричными кодами, поэтому сейчас я просто использую свой внутренний уникальный идентификатор, если URL содержит слишком много «не конвертируемых» символов.