Если вы анализируете HTML, независимо от того, как вы это делаете, вы просматриваете экран. Методы запускают гамбит из регулярных выражений в сторонние библиотеки, такие как jTidy. Единственная проблема в том, работает ли jTidy на Android? Я не знаю. Вам придется исследовать это.
Я бы предложил использовать регулярные выражения, скомпилировать их и кэшировать объект Pattern для производительности.
Если вы не можете получить надлежащий API веб-сервиса для нужных вам данных, вы всегда рискуете, чтобы автор изменил макет, переместил данные на вас и нарушил ваш код. Вот почему скрининг экрана, как правило, не одобряется и используется только в качестве последнего шага.