Конвертировать в UTF-8, затем кодировать url-символы не в [[:alnum:]]
.
\ Url-encoding - это где символ преобразуется в форму %<HIGHNIBBLE><LOWNIBBLE>
, где HIGHNIBBLE = (ch >> 4) & 0x0F
и LOWNIBBLE = (ch & 0x0F)
.
Более подробная информация содержится в RFC 1738 (S) 2.2.
Поскольку похоже, что вы используете Java, вам придется работать с byte[]
вместо String
или char[]
.