PHP: встроенный способ читать и находить вещи в HTML - PullRequest
1 голос
/ 13 апреля 2011

Если я правильно понял, вы должны держаться подальше от регулярных выражений, когда дело доходит до поиска вещей в HTML.Что является хорошей альтернативой тому, что встроено в стандартный PHP?

В моем конкретном случае сейчас я хочу найти все теги изображений с их атрибутами src, alt, height и width.Позже я также хочу найти определенные метатеги.В любом случае, как бы вы сделали это с PHP?

Версия PHP на моем веб-хосте в настоящее время 5.2.x.

Ответы [ 2 ]

4 голосов
/ 13 апреля 2011

Вы всегда можете использовать некоторые PHP DOM методы

3 голосов
/ 13 апреля 2011

Объект DOMXPath позволяет запускать запросы XPath к XML в PHP.XPath позволяет извлекать определенные теги из документов XML.Он не зависит от языка (как регулярные выражения), и практически каждый язык программирования поддерживает его.

$dom = new DOMDocument();
$dom->loadHTML('<html><body><img src="image.jpg" /></body></html>');
$xpath = new DOMXPath($dom);
$allImgNodes = $xpath->query("//img");
...