Конвертировать код символа HTML в char в Java - PullRequest
0 голосов
/ 12 июля 2011

Наш XML-канал дает нам закодированные символы UTF-8 в файле ISO-8859-1. Это подается в базу данных. Таким образом, текст в кодировке ISO-8859-1 и содержит следующее:

金融市场

Есть ли способ преобразовать это в обычную строку Java? Аналогично:

String str = fromHtmlUtf8("金融市场");

Где результирующая строка будет содержать обычные символы UTF8. Китайский в этом случае, но может быть довольно смешанным.

Спасибо.

Ответы [ 2 ]

3 голосов
/ 12 июля 2011

Вы можете использовать StringEscapeUtils от Apache Commons: http://commons.apache.org/lang/api-2.6/org/apache/commons/lang/StringEscapeUtils.html

в следующий раз искать раньше: Как конвертировать из HTML в UTF-8 в java

0 голосов
/ 11 января 2013

Если вам нужна небольшая библиотека для этого, вы можете использовать HTMLEntitles

http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=htmlentities

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...