Как конфертировать из HTML в UTF-8 в Java - PullRequest
8 голосов
/ 13 мая 2010

У меня есть строка ASCII с сущностями HTML, такими как:

 à
 ¨
 ç

Мне нужно, чтобы эта строка была без этих сущностей и конвертировала их в символы UTF-8. Есть ли в Java простой способ сделать это?

Где:

 Clazz.method("aà","UTF-8")

возвращает "аа"

или что-то в этом роде?

1 Ответ

16 голосов
/ 13 мая 2010

Взгляните на org.apache.commons.lang.StringEscapeUtils.unescapeHtml (...) . Очевидно, он понимает все символьные объекты, определенные в HTML 4.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...