PHP Dom не получает элемент - PullRequest
2 голосов
/ 19 марта 2010
$code = '
<h1>Galeria </h1>

<div class="galeria">
    <ul id="galeria_list">
        <li>
          <img src="img.jpg" width="350" height="350" />
          <br />
          Teste
        </li>
    </ul>
</div>';


$dom = new DOMDocument;
$dom->validateOnParse = true;

$dom->loadHTML($code);

var_dump($dom->getElementById('galeria_list'));

var_dump всегда возвращает NULL. Кто-нибудь знает почему? Я ясно вижу элемент с идентификатором galeria_list в $code. Почему это не получает элемент?

А также кто-нибудь знает, как предотвратить добавление документом тегов <html> и <body> в метод saveHTML?

Спасибо

Ответы [ 4 ]

4 голосов
/ 19 марта 2010

Похоже, что loadhtml () не "присоединяет" html dtd, который определяет id в качестве атрибута id к DOM. Но если html-документ содержит объявление DOCTYPE, он работает так, как задумано. (Но я думаю, вы не хотите добавлять doctype и html скелет, в любом случае:).

$code = '<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html><head><title>...</title></head>
<body>
  <h1>Galeria </h1>
  <div class="galeria">
    <ul id="galeria_list">
      <li>
        <img src="img.jpg" width="350" height="350" />
        <br />
        Teste
      </li>
    </ul>
  </div>
</body></html>';

$dom = new DOMDocument;
$dom->loadhtml($code);
var_dump($dom->getElementById('galeria_list'));
1 голос
/ 19 марта 2010

Кажется, что DOMDocument не будет хорошо играть с фрагментами HTML. Вы можете либо рассмотреть DOMDocumentFragment (как предлагает dnagirl ), либо рассмотреть вопрос о расширении DOMDocument.

После небольшого исследования я собрал простое расширение, которое достигнет того, что вы просите:

class MyDOMDocument extends DOMDocument {

    function getElementById($id) {

        //thanks to: http://www.php.net/manual/en/domdocument.getelementbyid.php#96500
        $xpath = new DOMXPath($this);
        return $xpath->query("//*[@id='$id']")->item(0);
    }

    function output() {

        // thanks to: http://www.php.net/manual/en/domdocument.savehtml.php#85165
        $output = preg_replace('/^<!DOCTYPE.+?>/', '',
                str_replace( array('<html>', '</html>', '<body>', '</body>'),
                        array('', '', '', ''), $this->saveHTML()));

        return trim($output);

    }

}

Использование

$dom = new MyDOMDocument();
$dom->loadHTML($code);

var_dump($dom->getElementById("galeria_list"));

echo $dom->output();
1 голос
/ 19 марта 2010

Вы можете рассмотреть DOMDocumentFragment , а не DOMDocument, если вам не нужны заголовки.

Что касается проблемы с id, это из руководства :

<?php

$doc = new DomDocument;

// We need to validate our document before refering to the id
$doc->validateOnParse = true;
$doc->Load('book.xml');

echo "The element whose id is books is: " . $doc->getElementById('books')->tagName . "\n";

?> 

validateOnParse, вероятно, проблема.

0 голосов
/ 19 марта 2010

Кто-то работал над этой проблемой в руководстве по PHP, используя XPath: http://us3.php.net/manual/en/domdocument.getelementbyid.php#96500

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...