Не существует такой вещи, как ASCII
коды, которые отображают китайские иероглифы.ASCII не представляет китайские символы.
Если у вас уже есть строка Java, она уже имеет внутреннее представление всех символов (US, LATIN, CHINESE).Затем можно кодировать эту строку Java в Unicode, используя UTF-8 или UTF-16 представления:
String s = "可以 告诉 我 "; ( РЕДАКТИРОВАТЬ : Эта строка не будет отображаться корректно в системах без шрифтов для китайских символов )
String s = "\u53ef\u4ee5\u544a\u8bc9\u6211";
byte utfString = s.getBytes("UTF-8");
Я смотрю на ваш обновленный вопрос, возможно, вы ищете класс StringEscapeUtils .Это из текста Apache Commons.И unescape ваши HTML объекты в строку Java:
String s = StringEscapeUtils.unescapeHtml("& #21487;& #20197;& #21578;& #35785;& #25105;"); // without spaces