В jsoup 1.6.2 Я добавил режим синтаксического анализатора XML, который анализирует ввод как есть, без применения правил синтаксического анализа HTML5 (содержимое элемента, структура документа и т. Д.). Этот режим сохранит текст в теге <link>
, допустит его кратное и т. Д.
Вот пример:
String xml = "<link>One</link><link>Two</link>";
Document xmlDoc = Jsoup.parse(xml, "", Parser.xmlParser());
Elements links = xmlDoc.select("link");
System.out.println("Link text 1: " + links.get(0).text());
System.out.println("Link text 2: " + links.get(1).text());
Возвращает:
Link text 1: One
Link text 2: Two