Question

Это мой код

<?php

/**
 * @author Joomlacoders
 * @copyright 2010
 */
    $url="http://urlchecker.net/html/demo.html";

    $innerHtml=file_get_contents($url);

    //echo $innerHtml;
    preg_match_all("{\<div id='news-id-.*d'\>(.*)\</div\>}",$innerHtml,$matches);

          //<div id='news-id-160346'>            

    var_dump($matches);

?>

Я хочу найти все содержимое в div id = 'news-id-160346'. Пожалуйста, помогите мне

zneak · Answer 1 · 01 июня 2010

Использовать HTML-парсер. НЕ регулярные выражения.

Проблема с регулярными выражениями заключается в том, что они не могут соответствовать вложенным структурам. Предполагая, что ваше регулярное выражение должно соответствовать одному <div> и его закрывающему тегу, нет способа правильно сопоставить этот ввод:

<div id="a">
    <div id="b">
        Foo
    </div>
</div>
<div id="c">
    Bar
</div>

Потому что, если ваше регулярное выражение жадное, оно будет соответствовать двум самым верхним элементам div, а если оно не слишком жадно, оно не будет соответствовать правильному конечному тегу.

Поэтому вам следует использовать анализатор HTML. С PHP DOMDocument::loadHTML или DOMDocument::loadHTMLFile каждый делает довольно хорошую работу. (Вы можете «безопасно» игнорировать генерируемые предупреждения: это только ошибки разметки, и сгенерированный объект DOMDocument должен быть в значительной степени нормальным.)

Поскольку PHP getElementById - трудная задача, вы можете использовать DOMXpath для той же цели:

<?php

$url = "http://urlchecker.net/html/demo.html";

$d = new DOMDocument();
$d->loadHTMLFile($url);

$xpath = new DOMXPath($d);
$myNews = $xpath->query('//@id="news-id-160346"')->item(0);

?>

Amarghosh · Answer 2 · 01 июня 2010

Используйте парсер, как предлагали другие.

Или попробуйте это регулярное выражение:

preg_match_all("#<div [^>]*id=['\"]news-id-\\d+['\"](.*?)</div>#", $innerHtml, $matches);
print_r($matches);

Проверьте вывод оператора print_r , чтобы понять, почему регулярное выражение не считается правильным инструментом для анализа html.

PHP регулярное выражение для соответствия div

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

PHP регулярное выражение для соответствия div

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы