Конвертировать Unicode-представления входящей строки в UTF-8? - PullRequest
2 голосов
/ 23 марта 2009

Я читаю некоторые данные, которые уже были преобразованы в код в стиле html.

Теперь мне нужно преобразовать это обратно в символы UTF-8 для просмотра. К сожалению, я не могу использовать браузер для просмотра строки.

Я читал о преобразовании в Java, и кажется, что если у вас есть строка \ uxxxx, то компилятор преобразует для вас; Однако это, конечно, не сработает, потому что я хочу читать в динамических строках.

Так можно ли это сделать?

Большое спасибо! Dan

Ответы [ 3 ]

4 голосов
/ 23 марта 2009

Вам необходимо использовать:

String StringEscapeUtils.unescapeJava(String str)

из библиотеки Apache Commons.

Он найдет \uxxxx последовательности во входной строке и преобразует их в обычную строку Java.

0 голосов
/ 23 марта 2009

преобразован в html-стиль и код.

Кто из них? \uXXXX является соглашением Java и не имеет ничего общего с HTML. HTML-объекты выглядят как ¯

0 голосов
/ 23 марта 2009

native2ascii

Используйте опцию "-reverse".

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...