Я пытаюсь написать робота, который будет ежедневно получать html-разбор.Теперь для разбора html я мог бы использовать только строковые функции, такие как explode или регулярные выражения, но я обнаружил, что код dom xpath намного чище, так что теперь я могу сделать конфигурацию всех сайтов, которые мне нужны, и тегов, которые я должен вырезать, как:
'http://examplesite.com' => '//div/a[@class="articleDesc"]/@href'
Итак, код выглядит следующим образом
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$tags = $xpath->query('//body/div[@class="articleDesc"]');
foreach ($tags as $tag)
echo $tag->nodeValue . "\n";
Итак, я получаю все теги div с описанием статьи класса, что мне здорово.Но я заметил, что все html-теги внутри тега div удалены.Интересно, как бы получить все содержимое этого div, на который я смотрю?
Мне также трудно найти какую-либо документацию для $ xpath-> query (), чтобы понять, как сформировать строку.Сайт php мало что говорит о его точном образовании.Тем не менее, моя главная проблема, я