Я пытаюсь получить определенный фрагмент необработанного текста с веб-сайта. Используя этот сайт и другие источники, я узнал, как получать определенные изображения, используя simpleXML и xpath.
Однако тот же подход, похоже, не работает для захвата необработанного текста. Вот что сейчас НЕ работает.
// first I set the xpath of the div that contains the text I want
$xpath = '//*[@id="storyCommentCountNumber"]';
// then I create a new DOM Document
$html = new DOMDocument();
// then I fetch the file and parse it (@ suppresses warnings).
@$html->loadHTMLFile($url);
// then convert DOM to SimpleXML
$xml = simplexml_import_dom($html);
// run an XPath query on the div I want using the previously set xpath
$commcount = $xml->xpath($xpath);
print_r($commcount);
Теперь, когда я получаю изображение, этот объект commcount будет возвращать массив, содержащий где-то источник изображений.
В этом случае я хочу, чтобы этот объект возвращал необработанный текст, содержащийся в div "storyCommentCountNumber". Но этот текст, кажется, не содержится в объекте, только название Div.
Что я делаю не так? Я могу видеть, что этот подход предназначен только для захвата HTML-элементов и битов внутри них, а не для необработанного текста. Как мне получить текст внутри этого div?
Спасибо!