Предполагая, что вы можете идентифицировать этот конкретный блок данных, поскольку это предполагает, что вы просто просматриваете каждый тег <div>
и одно и то же содержимое для каждого из них.
Он просто использует getElementsByTagName()
в различных уровней для выборки данных, с тегами <a>
, предполагается наличие 2 тегов, поэтому для получения данных от каждого из них используются [0]
и [1]
.
$nodes = $dom->getElementsByTagName('div');
foreach ($nodes as $node) {
echo $node->getElementsByTagName('h2')[0]->nodeValue."/";
$a = $node->getElementsByTagName('a');
echo $a[0]->nodeValue."/";
echo $a[1]->nodeValue."<br>";
}
что с образцом дает .. .
Google/Google is search engine/www.google.com<br>
Amazon/Amazon is shopping cart/www.amazon.com<br>
Yahoo/Yahoo is websites directory/www.yahoo.com<br>