Question

У меня есть пост ранее относительно удаления тегов html с пустым текстовым узлом.

$dom = new DOMDocument();
$dom->loadHtml(
    '<p><strong><a href="http://xx.org.uk/dartmoor-arts">test</a></strong></p>
    <p><strong><a href="http://xx.org.uk/depw"></a></strong></p>
    <p><strong><a href="http://xx.org.uk/devon-guild-of-craftsmen"></a></strong></p>
    <p>this line has a <br/>break</p>
    '
);

$xpath = new DOMXPath($dom);


while(($nodeList = $xpath->query('//*[not(text()) and not(node())]')) && $nodeList->length > 0) {
    foreach ($nodeList as $node) {
        $node->parentNode->removeChild($node);
    }
}


echo $dom->saveHtml();

работает отлично, но я не хочу, чтобы он удалял тег <br/> - как его сохранить?

Kirill Polishchuk · Answer 1 · 24 июля 2011

Используйте этот XPath (исключая br узлы):

//*[not(text() or node() or self::br)]

Yoshi · Answer 2 · 24 июля 2011

Просто протестируйте $node перед удалением, например:

if (!in_array($node->nodeName, array('br'))) {  // add further nodes to keep
  $node->parentNode->removeChild($node);
}

Nate · Answer 3 · 24 июля 2011

Попробуйте заменить теги <br/> на что-то вроде [br/], а затем восстановите их после.

Достаточно легкий трюк:)

Парсер DOM: удаляет теги пустого текстового узла

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Парсер DOM: удаляет теги пустого текстового узла

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов