Используя stream_context_create , вы можете указать заголовки, которые будут отправляться при вызове вашего file_get_contents
.
Что бы я предложил, откройте браузер и войдите на сайт. Откройте Firebug (или ваш любимый просмотрщик файлов cookie), возьмите файлы cookie и отправьте их с вашим запросом.
Редактировать: вот пример из PHP.net:
<?php
// Create a stream
$opts = array(
'http'=>array(
'method'=>"GET",
'header'=>"Accept-language: en\r\n" .
"Cookie: foo=bar\r\n"
)
);
$context = stream_context_create($opts);
// Open the file using the HTTP headers set above
$file = file_get_contents('http://www.example.com/', false, $context);
?>
Редактировать (2): Это выходит за рамки вашего вопроса, но если вы хотите знать, как очистить сайт, вы можете обратиться к методу DOMDocument :: loadHTML . По сути, это даст вам необходимые функции (например, запрос XPath , getElementsByTagName , getElementsById ) для очистки того, что вам нужно.
Если вы хотите очистить что-то простое, вы также можете использовать RegEx с preg_match_all .