jsoup очень умный. Он преобразует ваш входной текст в действительное HTML-содержимое, если вы используете его метод синтаксического анализа по умолчанию.
Document doc = Jsoup.parse(html);
На самом деле, jsoup может обрабатывать текст, похожий на xml (конечно, включая html и xml). Вы можете попробовать следующий метод для анализа xml-подобного текста. Он не изменит ваш ввод и не проанализирует ввод как есть.
Document doc = Jsoup.parse(html, "", Parser.xmlParser());