Существует ли быстрый способ распознавания кодов HTML ASCII в String или TextView? - PullRequest
4 голосов
/ 19 ноября 2010

Вот некоторые HTML-коды ASCII:

http://www.ascii.cl/htmlcodes.htm

У меня есть строка, которая может выглядеть как "All in a hard day 's work"

Какой лучший способ заменить этокод ascii, с апострофом?

Ответы [ 2 ]

4 голосов
/ 19 ноября 2010

Используйте Apache StringEscapeUtils.escapeHtml(String) или StringEscapeUtils.unescapeHtml(String). Это находится в общих библиотеках.

Если вам нужно сохранить какую-либо HTML-разметку, но просто удалить любую кодировку ascii, вам придется создать карту значений, которые вы хотите экранировать. Это упражнение в String манипулировании, поэтому его можно считать «безобразным хаком», но оно будет выполняться быстро.

Например, с некоторым псевдокодом, Создайте Map<String, String>() и заполните его значением, которое вы хотите заменить в качестве Ключа, и значением для его замены в Значение. Найдите HTML-код ascii в документе с помощью регулярного выражения, посмотрите код ascii в ваших Map заменах Заменить вхождение HTML-кода ascii на текстовый эквивалент.

Я выложу код на выходных, если у меня будет возможность.

3 голосов
/ 19 ноября 2010

Используйте Html.fromHtml(String) для декодирования строки.

...