Разбор искаженного HTML с PHP Dom - PullRequest
1 голос
/ 05 марта 2010

У меня есть клиент, который хочет, чтобы его видео (предоставленные третьей стороной) отображалось на их веб-сайте. Веб-сайт использует swfobject для отображения видео, поэтому я подумал, что было бы проще взять его и слегка изменить, чтобы он работал на веб-сайте клиента.

Использование PHP DOMDocument кажется правильным, но, к сожалению, предоставленный HTML-код искажен и вызывает сердечный приступ. Можно ли заставить его игнорировать ошибки в HTML или альтернативный способ сделать это?

Ответы [ 2 ]

3 голосов
/ 05 марта 2010

Это то, для чего PHP Tidy . Для пример :

<?php
ob_start();
?>
<html>a html document</html>
<?php
$html = ob_get_clean();

// Specify configuration
$config = array(
           'indent'         => true,
           'output-xhtml'   => true,
           'wrap'           => 200);

// Tidy
$tidy = new tidy;
$tidy->parseString($html, $config, 'utf8');
$tidy->cleanRepair();

// Output
echo $tidy;
?>

См. Параметры конфигурации HTML Tidy .

0 голосов
/ 15 января 2013

Если вам нравится jQuery, вы можете использовать " Simple HTML Dom Parser ". Отлично работает.

...