Мне нужно извлечь подробный контент сайта, сохранив все форматирование раздела. Раздел, который я хочу извлечь:
...
<div class="detailContent"><p>
<P dir=ltr><STRONG>Hinweis</strong>: Auf ... </p>
</div>
...
Мое текущее решение - использовать HTMLParser из libxml2 и xpath, чтобы найти узлы и пройтись по всем узлам, чтобы восстановить этот фрагмент HTML. Это длинный и сложный код.
Мне просто интересно, есть ли более простое решение для извлечения части HTML?
Спасибо.