Если html на самом деле является xhtml, вы можете проанализировать его с помощью SAX и извлечь содержимое xhtml из тега <content>
, но не так просто.
Вы должны будете заставить свой обработчик фактически реагировать на события, которые будут вызваны всеми тегами xhtml внутри тега <content>
, и либо создать что-то, напоминающее структуру DOM, которую затем можно сериализовать обратнов форму xml или непосредственно на лету записать в строковый буфер xml репликацию содержимого.
Если вы измените свой xml так, чтобы html внутри тега содержимого был обернут в элемент CDATA, как предложено в Как анализировать HTML-контент в Android с помощью SAX PARSER , что-то не слишком далеко от вашего кода действительно должно работать.
Но вы не можете просто поместить содержимое в переменную String tempStr
в методе characters
, как вы делаете.Вам понадобится метод startElement
, который инициализирует буфер для строки при просмотре тега <content>
, соберет в этот буфер метод characters
и поместит результат где-то в endElement
для <content>
тег.