Сама строка всегда будет в Unicode; Я не уверен, что вы подразумеваете под «преобразовать это в китайский текст», но чтобы преобразовать его в двоичное представление, используя UTF-8, вы бы использовали:
byte[] bytes = unicode.getBytes("UTF-8");
или вы можете использовать Charset
- например, используя библиотеку Guava , вы просто используете:
byte[] bytes = unicode.getBytes(Charsets.UTF_8);
(Это позволяет избежать хрупкости при указании строки и избежать беспокойства по поводу перехвата UnsupportedEncodingException
.)
Или вы можете объявить:
final static Charset UTF_8 = Charset.forName("UTF-8");
в верхней части вашего класса, чтобы избежать целой библиотеки в качестве лекарства для строки.