Мне нужна помощь, чтобы сделать несколько вещей с XPath в PHP.
С любым данным HTML мне нужно:
- Удалить все таблицы и их содержимое
- Удалить все после первого тега h1
- Сохранять только абзацы (ВКЛЮЧАЯ их внутренний HTML (ссылки, списки и т. Д.))
С регулярным выражением у меня все работает отлично. Однако, столкнувшись с вложенными таблицами, я решил, что действительно глупо анализировать HTML с помощью регулярных выражений.
Большое спасибо!