Хорошо, прежде всего, чтобы получить заголовки, используйте функцию PHP get_headers .
<?php
$url = "http://www.example.com/";
$headers = get_headers($url, true);
?>
Затем прочитайте содержимое страницы в переменную.
<?php
$handle = fopen($url, r);
$content = '';
while(! feof($handle)) {
$text .= fread($handle, 8192);
}
fclose($handle);
?>
Затем вам нужно пройти по контенту в поисках ресурсов и предварительно ожидая URL, чтобы получить абсолютный путь к ресурсу, если он уже не является абсолютным. Следующий пример регулярного выражения будет работать с атрибутами src (например, изображения и javascript) и должен дать вам отправную точку для просмотра других ресурсов, таких как CSS, который использует href = "". Это регулярное выражение не будет совпадать, если a: в источнике является хорошим индикатором того, что он содержит http: // и, следовательно, является абсолютным путем. ПОЖАЛУЙСТА, ОБРАТИТЕ ВНИМАНИЕ, это ни в коем случае не идеально и не учитывает все виды странных и замечательных мест размещения ресурсов, но это хорошее начало.
<?php
$pattern = '@src="([0-9A-Za-z-_/\.])+"@';
preg_match_all($pattern, $text, $matches);
foreach($matches[0] as $match) {
$src = str_replace('src="', '', $match);
$text = str_replace($match, 'src="' . $url . $src, $text);
}
print($text);
?>