Как получить innerHTML из DOMNode? - PullRequest
91 голосов
/ 18 января 2010

Какую функцию вы используете для получения innerHTML данного DOMNode в реализации PHP DOM? Может кто-нибудь дать надежное решение?

Конечно, externalHTML тоже подойдет.

Ответы [ 7 ]

23 голосов
/ 28 августа 2016

Вот версия в стиле функционального программирования в стиле:

function innerHTML($node) {
    return implode(array_map([$node->ownerDocument,"saveHTML"], 
                             iterator_to_array($node->childNodes)));
}
11 голосов
/ 13 мая 2016

Чтобы вернуть html элемента, вы можете использовать C14N () :

$dom = new DOMDocument();
$dom->loadHtml($html);
$x = new DOMXpath($dom);
foreach($x->query('//table') as $table){
    echo $table->C14N();
}
6 голосов
/ 28 июня 2016

Упрощенная версия ответа Хаима Эвги:

<?php

function innerHTML(\DOMElement $element)
{
    $doc = $element->ownerDocument;

    $html = '';

    foreach ($element->childNodes as $node) {
        $html .= $doc->saveHTML($node);
    }

    return $html;
}

Пример использования:

<?php

$doc = new \DOMDocument();
$doc->loadHTML("<body><div id='foo'><p>This is <b>an <i>example</i></b> paragraph<br>\n\ncontaining newlines.</p><p>This is another paragraph.</p></div></body>");

print innerHTML($doc->getElementById('foo'));

/*
<p>This is <b>an <i>example</i></b> paragraph<br>

containing newlines.</p>
<p>This is another paragraph.</p>
*/

Нет необходимости устанавливать preserveWhiteSpace или formatOutput.

4 голосов
/ 05 октября 2016

В дополнение к хорошей версии Trincot с array_map и implode, но на этот раз с array_reduce:

return array_reduce(
   iterator_to_array($node->childNodes),
   function ($carry, \DOMNode $child) {
        return $carry.$child->ownerDocument->saveHTML($child);
   }
);

До сих пор не понимаю, почему нет метода reduce(), который принимает как массивы, так и итераторы.

3 голосов
/ 05 июня 2014
function setnodevalue($doc, $node, $newvalue){
  while($node->childNodes->length> 0){
    $node->removeChild($node->firstChild);
  }
  $fragment= $doc->createDocumentFragment();
  $fragment->preserveWhiteSpace= false;
  if(!empty($newvalue)){
    $fragment->appendXML(trim($newvalue));
    $nod= $doc->importNode($fragment, true);
    $node->appendChild($nod);
  }
}
1 голос
/ 12 декабря 2018

Вот еще один подход, основанный на этом комментарии Drupella на php.net, который хорошо работал для моего проекта. Он определяет innerHTML(), создавая новый DOMDocument, импортируя и добавляя к нему целевой узел вместо явной итерации по дочерним узлам.

InnerHTML

Давайте определим эту вспомогательную функцию:

function innerHTML( \DOMNode $n, $include_target_tag = true ) {
  $doc = new \DOMDocument();
  $doc->appendChild( $doc->importNode( $n, true ) );
  $html = trim( $doc->saveHTML() );
  if ( $include_target_tag ) {
      return $html;
  }
  return preg_replace( '@^<' . $n->nodeName .'[^>]*>|</'. $n->nodeName .'>$@', '', $html );
}

где мы можем включить / исключить внешний целевой тег через второй входной аргумент.

Пример использования

Здесь мы извлекаем внутренний HTML-код для целевого тега, заданного атрибутом «first» id:

$html = '<div id="first"><h1>Hello</h1></div><div id="second"><p>World!</p></div>';
$doc  = new \DOMDocument();
$doc->loadHTML( $html );
$node = $doc->getElementById( 'first' );

if ( $node instanceof \DOMNode ) {

    echo innerHTML( $node, true );
    // Output: <div id="first"><h1>Hello</h1></div>    

    echo innerHTML( $node, false );
    // Output: <h1>Hello</h1>
}

Живой пример:

http://sandbox.onlinephpfunctions.com/code/2714ea116aad9957c3c437d46134a1688e9133b8

...