Синтаксический анализ XML с помощью SAX: как обрабатывать html как текст в тегах xml - PullRequest
1 голос
/ 06 ноября 2011

Я получаю ответ xml от внешнего сервера.

Используя некоторые учебные пособия, я запустил SAX-Parser.

Осталась небольшая проблема.например, ответ содержит тег описания, содержащий html, например:

<description><p><strong>Title</strong></p>Description</description> 

После разбора поле описания моего объекта содержит только "<". </p>

Можно ли указать моему анализатору обрабатывать htmlв виде простого текста?

Или, может быть, есть другие возможности для решения этой проблемы.

Спасибо.

Ответы [ 2 ]

2 голосов
/ 06 ноября 2011

, так как вы не включили свой код, я должен представить, что вы написали. Обычная ошибка в реализациях обработчиков SAX не связана с тем, что текст элемента может быть возвращен в вызовах метода characters (). вам нужно объединить их все вместе, пока не получите событие endElement ().

0 голосов
/ 06 ноября 2011

Помимо решения SAX, вы можете вместо этого использовать решение Stax (javax.xml.stream): это такая же производительность, как SAX, но часто немного более удобная.Вы также можете принудительно объединить текстовое содержимое (XMLInputFactory.IS_COALESCING), чтобы избежать проблем, с которыми вы сталкиваетесь в SAX.

...