file_get_contents не загружает полный исходный код, потому что части загружаются при загрузке страницы - PullRequest
0 голосов
/ 18 марта 2012

Я хочу скопировать весь исходный код внешнего веб-сайта в файл для последующей модификации и анализа. Но таблица на domain.com/stats не является статическим HTML, а построена на JavaScript и загружается при загрузке страницы.

Проблема в том, что он не включен в исходный код!

Вот как мой код выглядит сейчас:

$txt = file_get_contents('http://domain.com/stats');
file_put_contents(dirname(__FILE__) . '/statistic/stats.html', $txt);

Есть ли способ обойти это?

Ответы [ 2 ]

0 голосов
/ 18 марта 2012

Единственный способ запустить JavaScript - использовать браузер без монитора для получения и выполнения сценариев.

0 голосов
/ 18 марта 2012

если вы сканируете $txt для динамически загружаемого контента, вы можете выполнить дополнительные file_get_contents запросы для извлечения этого контента и сохранения их вместе с исходным контентом.

...