Как разобрать документ с тегами html? - PullRequest
0 голосов
/ 04 мая 2020

Имеется документ с плавающей структурой:

некоторый случайный текст

форматирование для другого источника

<!-- customtag --->

<!-- subtag structure --> ... <!-- subtag END -->

Ищу что-то, что я могу применить к задаче синтаксического анализа блока custom tag и создания из него объекта (несколько на документ).

В настоящее время ищу в направлении JAXB, StAX, JSoup и всего, что Google может предоставить в этом вопросе. JAXB дает хорошее начало, но я не вижу, как настроить его tag structure.

...