Простой HTML DOM не возвращает полную страницу - PullRequest
0 голосов
/ 15 октября 2019

Мне нужно убрать вакансии с этого URL, но после некоторых попыток я не могу действительно позволить странице полностью загрузиться. вакансии и некоторые другие вещи на сайте не загружаются.

Я не могу получить доступ к сайту без агента пользователя, но когда я сбросил результат скребка с агентом пользователя, он, кажется, не загружаетсяполностью.

    include('simple_html_dom.php');
    $html = new simple_html_dom();
    $ch = curl_init();
    /* Set options for the cURL */
    curl_setopt($ch, CURLOPT_URL, 'https://careers.booking.com/amsterdam-jobs');
    curl_setopt($ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    $return = curl_exec($ch);
    $html->load($return);
    echo $html;

Мне нужно загрузить всю страницу с: "https://careers.booking.com/amsterdam-jobs", чтобы получить вакансии, но я не могу их найти, потому что там не загружено.

...