Проблемы с получением исходного кода с веб-страницы - PullRequest
0 голосов
/ 18 сентября 2018

Я написал скрипт на php, чтобы получить html-контент или исходный код с веб-страницы, но мне это не удалось.Когда я выполняю свой скрипт, он открывает саму страницу.Как я могу получить элемент HTML или исходный код?

Это скрипт:

<?php
include "simple_html_dom.php";
function get_source($url)
{
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    $htmlContent = curl_exec($ch);
    curl_close($ch);
    $dom = new simple_html_dom();
    $dom->load($htmlContent);
    return $dom;
}
$scraped_page = get_source("https://stackoverflow.com/questions/tagged/web-scraping");
echo $scraped_page;
?>

В настоящее время я получаю вот так:

enter image description here Мой ожидаемый результат примерно такой:

enter image description here Кстати, echoing $htmlContent также дает мне то, что вы можете увидеть на рисунке 1.

...