Разбор HTML номеров, таких как "& # 189" в DOM Parser - Android - PullRequest
0 голосов
/ 09 ноября 2010

Я занимаюсь разработкой проекта для Android.Я использую DOM Parser для анализа XML-файла.Проблема в том, что мой xml-файл содержит html-числа, такие как ½ (точка с запятой будет стоять в конце каждого символа кода)

, например

<quote>We &#8220;love&#8221; our nation</quote> 

, что является ничем иным, как

<quot>We "love" our nation</quote> 

Я не могу разобрать этот номер HTML в синтаксическом анализе, когда я пытаюсь получить значение узла, я получаю нулевое значение.

Может кто-нибудь сказать мне, как проанализировать эти коды символов HTML?

или

Как преобразовать этот код символа html в текстовый код символа или кодировку Юникод, заданную в моем канале xml?

Ответы [ 2 ]

1 голос
/ 09 ноября 2010

Здесь очень похожий вопрос: HTML-кодирование Android в xml-файле

Кажется, что символы html нарушают синтаксический анализатор DOM, поэтому он не может получить строку из сущности xml.

Существует функция HTML для анализа HTML в строке:

TextView tv = (TextView) findViewById(R.id.tv);
String s = <quote>We &#8220;love&#8221; our nation</quote>";
tv.setText(Html.fromHtml(s));

Выходы:

Мы "любим" нашу нацию

Однако кажется, что DOM не получает строку для преобразования, поэтому может пригодиться следующая статья: Использование XPATH и HTML Cleaner для анализа HTML / XML

0 голосов
/ 09 ноября 2010

Я использовал xmlpullparser. Теперь работает нормально. :)

...