Я написал скрипт на php
, чтобы получить html-контент или исходный код с веб-страницы, но мне это не удалось.Когда я выполняю свой скрипт, он открывает саму страницу.Как я могу получить элемент HTML или исходный код?
Это скрипт:
<?php
include "simple_html_dom.php";
function get_source($url)
{
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$htmlContent = curl_exec($ch);
curl_close($ch);
$dom = new simple_html_dom();
$dom->load($htmlContent);
return $dom;
}
$scraped_page = get_source("https://stackoverflow.com/questions/tagged/web-scraping");
echo $scraped_page;
?>
В настоящее время я получаю вот так:
Мой ожидаемый результат примерно такой:
Кстати, echoing $htmlContent
также дает мне то, что вы можете увидеть на рисунке 1.