Для извлечения удаленных страниц с файлом file_get_contents требуется fopen_wrappers . Если у вашего хоста это отключено и они позволяют cURL () , я бы пошел по этому пути. cURL также обычно быстрее, чем file_get_contents, так что это также может быть решающим фактором.
EDIT:
Проблема, с которой вы столкнулись, особенно в Google, заключается в том, что он использует код JS на веб-странице. Я просто var_dump'ed htmlString, и все это отображается нормально. Но когда мы вернули его обратно в JavaScript, все пошло наперекосяк. Ошибка, которая вернулась, была литералом Unterminated String (через консоль ошибок Firefox) в строке 8. Вероятно, из-за некоторых одинарных кавычек и т. Д. В моем тесте я попытался htmlentities () , который работал и отображал данные в браузер. Раздел для изменения:
$htmlString= htmlentities(file_get_contents('http://google.com'));
И это должно работать так, как вы хотите.