Вы могли бы сделать что-то вроде этого:
$doc = new DomDocument();
@$doc->loadHTMLFile($url);
$xpath = new DOMXpath($doc);
$nodeList = $xpath->query("your-xpath-query");
foreach ($nodeList as $node) {
// grab the content, attributes or whatever you'r looking for
}
Используя запросы Xpath, вам не нужно вручную обходить дерево DOM, и ваш сценарий более устойчив к структурным изменениям в сайтах, которые вы сканируете.
Я надеюсь, что вы попадете на правильный путь.Для более подробного примера вы должны предоставить больше информации.