Предупреждение: возможно, слегка ржавый ответ:
Примечание: не обсуждаются проблемы с именем хоста (IDNS).
Единственная полностью безопасная вещь здесь - использовать% -экранированный UTF-8. Некоторые браузеры отображают это как то, что вы хотите, а некоторые отображают% -escapes. (например, http://foo.bar/%ee%cc%cf.html)
Если вы добавите в URL «настоящий UTF-8», многие вещи будут работать, но в некоторых браузерах могут быть неприятные сюрпризы для некоторых людей. Я читаю ваш вопрос как имеющий дело со 100% статическим контентом. Если вы пытаетесь сделать это с помощью кода за сайтом, у вас есть дополнительные проблемы для работы.
«Неприятными сюрпризами» будут (а) люди, находящие% xx в URL нечитабельными, (б) браузер, который тает, (в) какое-то приложение для очистки или агрегирования данных.
Хотелось бы, чтобы я был в курсе этого, но я нет, поэтому я рекомендую развернуть тестовый сайт, а затем попытаться получить к нему доступ со всем, на что вы можете положиться, включая мобильные телефоны. Убедите Google проиндексировать его и посмотреть, что там происходит.