Застрял в Simple Html Dom и извлекать информацию - PullRequest
2 голосов
/ 06 октября 2009

Я пытаюсь использовать простой HTML DOM, чтобы извлечь все внутри тега с классом "sitepoint". Вот мой код, который не работает:

<?php
include_once('simple_html_dom.php');

$html = file_get_html('examplewebsite');
$ret = $html->find('.sitepoint');
echo $ret;

?>

Ниже приведен пример одного из тегов sitepoint (их около десяти) с информацией, внутри которой я хочу.

<dl class="sitepoint">
<dd class="thumbnail">
<a href="blabla" ></a><a href="/toolbar/sidepanel.php?url=random.html" >Get This      Now</a>   </dd><dt class="notext"><a href="/to/" >Title</a></dt><dd class="starts">
<table width="100%" cellpadding="0" cellspacing="0" border="0">
<tr><td class="textUncolor"> CUT OUT SOME IMAGES AND       ADDRESSES HERE
                            </td></tr>
</table>
</dd>

Может кто-нибудь помочь мне заставить его работать?

1 Ответ

0 голосов
/ 06 октября 2009

Вам необходимо получить доступ к атрибуту externaltext.

 $html->find('.sitepoint',0)->outertext;

Проверьте документы для получения дополнительной информации. Смотрите в разделе "магические атрибуты"

РЕДАКТИРОВАТЬ

При выборе классов вам необходимо указать, какой из них вы используете в документе. Я изменил приведенный выше пример, чтобы отразить это. Это проверено и работает. (обратите внимание на 0 как второй параметр для поиска)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...