В настоящее время я очищаю веб-сайт и имею все полезные данные, которые мне нужны, хотя он содержит немного данных, которые мне не нужны.
Пример:
<h2>Heading</h2>
<p>Useful <a href="/foo">data</a></p>
Rubbish <a href="/bar">data</a>
<h2>heading</h2>
Итак, я хочу удалить весь текст, который не заключен ни в теги h2
, ни в p
.
Есть ли легкая функция / preg?