Как разобрать (не правильно) HTML в Android? - PullRequest
1 голос
/ 27 ноября 2009

Как разобрать не правильно сформированный HTML в Android?

Я пытался использовать XOM и TagSoup, но я получаю следующую ошибку при создании Builder:

11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.

Должен ли я установить Xerces для использования XOM или я могу использовать tagoup без XOM?

Ответы [ 2 ]

2 голосов
/ 28 ноября 2009

Возможно, JTidy (http://jtidy.sourceforge.net/)) - порт HTMLTidy достаточно легкий. Он выводит XHTML по запросу

0 голосов
/ 27 ноября 2009

XOM может потребовать, чтобы Xerces находился в пути к классам - это может зависеть от версии Java. В настоящее время мы используем

xercesImpl-2.8.0.jar
...