Разбор HTML без xpath - PullRequest
1 голос
/ 11 мая 2011

Я пытаюсь создать простой инструмент для разбора HTML-файлов.

В частности, мне нужно получить все атрибуты name из всех тегов div.

Моя строка HTML меняется, и я не могу ее контролировать, поэтому, если я пытаюсь использовать xpath, я получаю ошибки, поскольку HTML-код написан неправильно на 100%.

Есть идеи?

Спасибо

1 Ответ

2 голосов
/ 11 мая 2011

Существует также отличный класс, который называется PHP Simple HTML DOM Parser на http://simplehtmldom.sourceforge.net/

Прекрасно работает с недопустимым HTML, но требует много памяти для анализа длинных html-файлов.

...