HTML-парсеры Java изменяют страницу - PullRequest
1 голос
/ 20 июля 2011

Можно ли использовать какой-то HTML-парсер, с помощью которого я буду выбирать информацию, под которой должен отображаться тег, и просто очищать все остальное?

Я пытался использовать Jsoup.Разработка для Android.Выбор durig мое приложение падает из-за 'outofmemmoryerror'

1 Ответ

2 голосов
/ 20 июля 2011

Вы можете извлечь часть тега с помощью JSoup и выделить его

Например:

String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();
String text = doc.body().text(); // "An example link" , and ignore the rest
...