Zend_Dom дает вам элемент DOME ... как мне его использовать? - PullRequest
5 голосов
/ 30 ноября 2010

Я пытаюсь использовать Zend_Dom для некоторой очень легкой очистки экрана (я хочу получить заголовок, небольшой текст и ссылку из небольшого блока новостей на моем веб-сайте), и я не уверен, как справиться DOMElement, который он мне дает.

В руководстве к Zend_Dom код гласит:

foreach ($results as $result) {
    // $result is a DOMElement
}

Как использовать этот элемент DOME?

Подробный пример (ищите якорные элементы в Google):

$url='http://google.com/';
$client = new Zend_Http_Client($url);
$response = $client->request();
$html = $response->getBody();
$dom = new Zend_Dom_Query($html);
$results = $dom->query('a');
foreach($results as $r){
     Zend_Debug::dump($r);
}

Это дает мне:

object(DOMElement)#81 (0) {
}
object(DOMElement)#82 (0) {
}
object(DOMElement)#83 (0) {
}
... etc, etc...

Что меня смущает, так это то, что каждый элемент не содержит ничего (0)! Это не тот случай, но это мое первое впечатление. Так что я брожу по сети и обнаруживаю, что могу добавить nodeValue, чтобы получить что-то из этого:

Zend_Debug::dump($r->nodeValue);

что дает мне:

string(6) "Images"
string(6) "Videos"
string(4) "Maps"
...etc, etc...

Но где я сталкиваюсь с проблемами - это получение определенных элементов и их содержимого.

Например, учитывая этот HTML:

  <div class="newsBlurb">
   <span class="newsDate">Mon, 11 October 2010</span>
   <h3 class="newsHeadline"><a href="http://foo.com/1/2/">Some text</a></h3>
   <a class="newsMore" href="http://foo.com/1/2/">More</a>
  </div> 
  <div class="hr"></div>
  <div class="newsBlurb">
   <span class="newsDate">Mon, 16 August 2010</span>
   <h3 class="newsHeadline"><a href="http://bar.com/pants.html">Stuff is here</a></h3>
   <a class="newsMore" href="http://bar.com/pants.html">More</a>
  </div> 

Я могу получить текст из каждого newsBlurb, используя технику, которую я использую в примере Google, но не могу получить каждый элемент сам по себе. Я хочу получить дату и вставить ее где-нибудь, получить текст заголовка и вставить ее где-нибудь и получить ссылку для использования. Но все, что я получаю, это фактический текст в div.

Как я могу получить то, что я хочу от этого?


EDIT Вот еще один пример, который не работает, как я ожидаю. Есть идеи почему?

$url = 'http://php.net/manual/en/class.domelement.php';
$client = new Zend_Http_Client($url);
$response = $client->request();
$html = $response->getBody();
$dom = new Zend_Dom_Query($html);
$newsBlurbNode = $dom->query('div.note');
Zend_Debug::dump($newsBlurbNode);

это дает мне:

object(Zend_Dom_Query_Result)#867 (7) {
  ["_count":protected] => NULL
  ["_cssQuery":protected] => string(8) "div.note"
  ["_document":protected] => object(DOMDocument)#79 (0) {
  }
  ["_nodeList":protected] => object(DOMNodeList)#864 (0) {
  }
  ["_position":protected] => int(0)
  ["_xpath":protected] => NULL
  ["_xpathQuery":protected] => string(33) "//div[contains(@class, ' note ')]"
}

Пытаясь извлечь из этого что-нибудь, я использовал:

$children = $newsBlurbNode->childNodes;
     foreach ($children as $child) {
       }

Что приводит к ошибке, потому что в цикле foreach ничего нет. Ack! Что я не получаю?

Ответы [ 2 ]

2 голосов
/ 16 декабря 2010

Эй, я возился с чем-то похожим - дай мне знать, если этого достаточно, чтобы помочь тебе - если нет, я могу объяснить это еще немного.

2 голосов
/ 30 ноября 2010

Вы можете использовать что-то вроде этого, чтобы получить доступ к отдельным узлам:

$children = $newsBlurbNode->childNodes;
foreach ($children as $child) {   
    //do something with individual nodes
} 

В противном случае я бы прошел: http://php.net/manual/en/class.domelement.php

...