Предупреждение file_get_contents в DOM Parser - PullRequest
0 голосов
/ 03 октября 2018

В моем случае я хочу отказаться от веб-сайта, что является успешным, и я использую PHP cURL.Проблема начинается, когда я хочу использовать анализатор DOM, чтобы получить нужный контент.Вот предупреждение:

изображение ошибки здесь

И код, который я использую, здесь.Перед этим кодом я перебираю сайт, используя cURL, он работает, но только в этой части есть ошибка:

include 'simple_html_dom.php';

//Here is where I scraping, no need to show it

$fp = fopen(dirname(__FILE__) . '/airpaz.html', 'w');

//$html contain the page I scrap

fwrite($fp, $html);
fclose($fp);

$html_content = file_get_contents(dirname(__FILE__) . '/airpaz.html');

echo $html_content;

$html2 = new simple_html_dom();
$html2->load_file($html_content);

Надеюсь, вы, ребята, можете помочь, спасибо

Ответы [ 2 ]

0 голосов
/ 03 октября 2018

Похоже, вы пытаетесь прочитать файл 3 раза:

$read_file = fread($fr, filesize(dirname(__FILE__) . '/airpaz.html'));

и:

$html_content = file_get_contents($read_file);

и:

$html2->load_file($html_content);

В последнемв двух случаях вместо имени файла вы передаете html-содержимое в функцию, чтобы оно не работало.

Вы должны прочитать файл только один раз и использовать строковые функции для полученного содержимого.Или вы открываете URL прямо в $html2->load_file().

0 голосов
/ 03 октября 2018

попробуйте этот код

include 'simple_html_dom.php';

$html_content = file_get_html(dirname(__FILE__) . '/airpaz.html');

echo $html_content;

$html2 = new simple_html_dom();
$html2->load_file($html_content);
...