String
класс имеет конструктор:
new String(byte[] bytes, Charset charset)
и метод:
byte[] getBytes(Charset charset)
Учитывая, что я определяю свой charset
следующим образом:
Charset charset = Charset.forName("UTF-8");
Какую кодировку я на самом деле буду использовать? В частности, это стандарт UTF-8 (как описано в RFC 3629 ), или CESU-8 , или модифицированный UTF-8 ? (См. Также соответствующую статью Википедии )
В случае, если это не стандартный UTF-8, есть ли библиотека, позволяющая выполнять строковые операции в utf8?
Конвертер для этих кодировок, полученных из UTF-8, более чем приветствуется!