php DOMDocument-> getElementById-> nodeValue sripping html - PullRequest
0 голосов
/ 10 февраля 2011

Я использую php DOMDocument->getElementById->nodeValue, чтобы установить HTML-код конкретного элемента DOM.Проблема в том, что строка преобразуется в объекты HTML: например: nodeValue = html_entity_decode('<b>test</b>'); должен выдавать 'test', но вместо этого выводится '&lt;b&gt;test&lt;/b&gt;'

Есть идеи, почему?Это происходит, даже если я не использую функцию html_entity_decode

Вот мой обновленный скрипт ... который сейчас работает:

// Construct a DOM object for updating the affected node
$html = new DOMDocument("1.0", "utf-8"); 
if (!$html) return FALSE;

// Load the HTML file in question
$loaded = $html->loadHTMLFile($data['page_path']);
if (!$loaded)
{
    print 'Failed to load file';
    return FALSE;
}

// Establish the node being updated within the file
foreach ($data['divids'] as $divid)
{
    $element = $html->getElementById($divid);
    if (is_null($element))
    {
        print 'Failed to get existing element';
        return FALSE;
    }

    $newelement = $html->createElement('div');
    if (is_null($newelement))
    {
        print 'Failed to create new element';
        return FALSE;
    }
    $newelement->setAttribute('id', $divid);
    $newelement->setAttribute('class', 'reusable-block');

    // Perform the replacement
    $newelement->nodeValue = $replacement;
    $parent = $element->parentNode;
    $parent->replaceChild($newelement, $element);

    // Save the file back to its location
    $saved = $html->saveHTMLFile($data['page_path']);
    if (!$saved)
    {
        print 'Failed to save file';
        return FALSE;
    }
}

// Replace HTML entities left over
$content = files::readFile($data['page_path']);
$content = str_replace('&lt;', '<', $content);
$content = str_replace('&gt;', '>', $content);
if (!@fwrite($handle, $content))
{
    print 'Failed to replace entities';
    return FALSE;
}

1 Ответ

2 голосов
/ 10 февраля 2011

Это правильное поведение - ваш тег преобразуется в строку, а строки в XML не могут содержать угловые скобки (могут только теги).Попробуйте преобразовать HTML-код в DOMNode и добавить его вместо этого:

$node = $mydoc->createElement("b");
$node->nodeValue = "test";
$mydoc->getElementById("whatever")->appendChild($node);

Обновить с рабочим примером:

$html = '<html>
    <body id="myBody">
        <b id="myBTag">my old element</b>
    </body>
</html>';

$mydoc = new DOMDocument("1.0", "utf-8");
$mydoc->loadXML($html);

// need to do this to get getElementById() to work
$all_tags = $mydoc->documentElement->getElementsByTagName("*");
foreach ($all_tags as $element) {
    $element->setIdAttribute("id", true);
}

$current_b_tag = $mydoc->getElementById("myBTag");
$new_b_tag = $mydoc->createElement("b");
$new_b_tag->nodeValue = "my new element";
$result = $mydoc->getElementById("myBody");
$result->replaceChild($new_b_tag, $current_b_tag);

echo $mydoc->saveXML($mydoc->documentElement);
...