Как извлечь innerHTML с помощью PHP Dom - PullRequest
3 голосов
/ 09 марта 2012

В настоящее время я использую nodeValue для вывода HTML-кода, однако он удаляет HTML-код и просто дает мне простой текст. Кто-нибудь знает, как я могу изменить свой код, чтобы дать мне внутренний HTML-элемент, используя его идентификатор?

function getContent($url, $id){

// This first section gets the HTML stuff using a URL
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_BINARYTRANSFER, true);
$html = curl_exec($ch);
curl_close($ch);

// This second section analyses the HTML and outputs it
$newDom = new domDocument;
$newDom->loadHTML($html);
$newDom->preserveWhiteSpace = false;
$newDom->validateOnParse = true;

$sections = $newDom->getElementById($id)->nodeValue;
echo $sections;


}

Ответы [ 2 ]

2 голосов
/ 09 марта 2012

Это работает для меня:

$sections = $newDom->saveXML($newDom->getElementById($id));

http://www.php.net/manual/en/domdocument.savexml.php

Если у вас PHP 5.3.6, это также может быть опция:

$sections = $newDom->saveHTML($newDom->getElementById($id));

http://www.php.net/manual/en/domdocument.savehtml.php

0 голосов
/ 20 апреля 2014

Я изменил код, и он работает нормально для меня. Пожалуйста, найдите ниже код

    $ch = curl_init($url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_BINARYTRANSFER, true);
    $html = curl_exec($ch);
    curl_close($ch);
    $newDom = new domDocument;
    libxml_use_internal_errors(true);
    $newDom->loadHTML($html);
    libxml_use_internal_errors(false);
    $newDom->preserveWhiteSpace = false;
    $newDom->validateOnParse = true;

    $sections = $newDom->saveHTML($newDom->getElementById('colophon'));   
    echo $sections;
...