есть ли способ преобразовать html-страницу в xml и получить данные (синтаксический анализ), такие как RSS-канал? Спасибо
Если html правильно сформирован, вы можете использовать обычный SAX-парсер для разбора html.
HTML, к сожалению, часто плохо сформирован. В этом случае вы можете сначала проанализировать html на сервере, используя tag-soup. Если это невозможно, вы можете попробовать использовать jtidy на устройстве.
Как разобрать (не правильно сформированный) HTML в android?