Не могу получить целевой div с php curl из flarum - PullRequest
0 голосов
/ 01 октября 2018

Я пытаюсь получить последнюю статью от flarum.org, но она не получает сообщения.Он работает на других обычных сайтах, но не работает в flarum.

Вот моя функция:

function questions() {

    $url = 'https://discuss.flarum.org/';

    $curl = curl_init();
    curl_setopt( $curl, CURLOPT_URL, $url );
    curl_setopt( $curl, CURLOPT_HEADER, 0 );

    // SSL support
    curl_setopt( $curl, CURLOPT_SSL_VERIFYPEER, false );
    curl_setopt( $curl, CURLOPT_FOLLOWLOCATION, true );
    curl_setopt( $curl, CURLOPT_USERAGENT, $_SERVER[ 'HTTP_USER_AGENT' ] );

    // Variable support
    curl_setopt( $curl, CURLOPT_RETURNTRANSFER, true );

    $result = curl_exec( $curl );

    //echo $result;

    $result = str_replace( array( "\n", "\t", "\r" ), null, $result );

    preg_match_all( '#<div class="DiscussionListItem">(.*?)</div>#', $result, $match );

    print_r( $match );

    curl_close( $curl );

}

Эта функция печатает пустой массив.

1 Ответ

0 голосов
/ 01 октября 2018

Это не то, как разбирать HTML.Вместо этого используйте анализатор HTML.Примерно так будет работать, если бы в HTML были какие-либо подходящие элементы:

$url = "https://discuss.flarum.org/";
$html = file_get_contents($url);
$dom = new DomDocument();
libxml_use_internal_errors(true);
$dom->loadHTML($html);
$xpath = new DomXPath($dom);
$results = $xpath->query("//div[@class='DiscussionListItem']");
foreach ($results as $result) {
    echo $result->nodeValue;
}

Конечно, в HTML нет соответствующих элементов.Возможно, вам лучше изменить запрос XPath на //div[@class='container']/ul/li/a.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...