У меня есть строка HTML, например
<b>test</b><b>er</b>
<span class="ab">continue</span><span> without</span>
Я хочу свернуть теги, которые похожи и принадлежат друг другу. В приведенном выше примере я хочу иметь
<b>tester</b>
, поскольку теги имеют тот же тег без каких-либо дополнительных атрибутов или стиля. Но для тега span
он должен остаться прежним, поскольку он имеет атрибут class
. Мне известно, что я могу выполнять итерации через Jsoup по дереву.
Document doc = Jsoup.parse(input);
for (Element element : doc.select("b")) {
}
Но мне не ясно, как смотреть вперед (я думаю, что-то вроде nextSibling
), но чем как свернуть элементы?
Или существует простое слияние регулярных выражений?
Атрибуты, которые я могу указать самостоятельно. Нет необходимости иметь универсальное решение для тегов.