Web Crawler печатает первый текст, который он видит при выполнении - PullRequest
0 голосов
/ 17 сентября 2018

Я пытался закодировать веб-сканер, используя этот исправленный код, приведенный ниже, к сожалению, он повторяет начальный текст, который он видит на сайте, а не текст, который я специально просил его извлечь

Понятия не имею, где я ошибся

КОД ИДЕТ КАК:

        function get_datab($url) {
        $ch = curl_init();
        curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
        curl_setopt($ch, CURLOPT_URL,$url);
        $result=curl_exec($ch);
        curl_close($ch);
    return $result;
}
    $returned_content = get_datab('https://soovle.com/top/');
        $first_step = explode( '<div class="column"' , $returned_content );
        $second_step = explode('</div>', $first_step[0]);
        $third_step = explode('<div class="letter"', $second_step[1]);
        $fourth_step = explode('<div class="correction"', $third_step[0]);

    foreach ($fourth_step as $key=>$element) {

    $head = 'https://soovle.com/top/';
    $child_first = explode( '<span' , $element );
    $child_second = explode( '</span>' , $child_first[0] );
    $link = $head . trim($child_second[0], '\'"');
    $final = "<a target = '_blank' style='font-style: normal;' href=\"".$link."</a></br>";


    echo $final;

    if($key==10){
            break;
        }
    }

URL, который я пытаюсь проанализировать: "https://soovle.com/top/"

Любая помощь приветствуется.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...