Я делаю именно то, что вы просите - находите фрагменты HTML в куске текста - оборачивая тег вокруг текста, затем используя java.xml.parsers.DocumentBuilder для создания дерева DOM.1002 * Основная идея (и большая часть опущена) просто
String fragment = "<wrap_node>" + orig_text + "</wrap_node>";
Document d = builder.parse(fragment);
Если теги не правильно сформированы ... отсутствует конец, неправильное вложение и т. Д. ... это не сработает, ноэто работает для меня, потому что я хочу отказаться от всего, что искажено.