форматирование документов - PullRequest
3 голосов
/ 11 августа 2009

Я пытаюсь прочитать текст определенной веб-страницы для отображения на отдельной веб-странице, но у меня возникли некоторые проблемы с этим. Прямо сейчас я использую следующий код

<?php
@$doc = new DOMDocument();
@$doc->loadHTMLFile('http://foo.com');
@$tags = $doc->getElementsByTagName('body');
foreach ($tags as $tag) {
    $index_text .= $tag->nodeValue;
    print nl2br($tag->nodeValue).'<br />';
}
?>

Этот код работает, однако, похоже, он удаляет много форматирования, что важно для меня, например разрывы строк. Как я могу это предотвратить

1 Ответ

7 голосов
/ 11 августа 2009

Атрибут formatOutput в DOMDocument сделает это.

$doc->formatOutput = true;

Это приведет к тому, что вывод DOM будет выводиться больше для потребления человеком, с разрывами строк там, где они вам понадобятся, и отступом, т. Е. 'Pretty print'.

Значением по умолчанию для этого значения является false, поэтому вы должны явно установить его на true при необходимости.

...