Для получения данных существует три уровня сложности:
file_get_contents($url); //easy
К сожалению, многие сайты не очень чувствительны к правильному пользовательскому агенту. У вас есть два варианта здесь. Один немного сложнее, чем другой. Промежуточное звено Zend HTTP-клиент
$client = Zend_Http_Client(); //make sure to include Zend_Http, etc.
$client->setConfig($params); // params will include proper user agent
$client->setUri($aUrl);
$html = $client->request()->getBody();
Вариант третий, который вы, возможно, даже не захотите рассматривать, если только вы действительно не хотите, чтобы он был более скриптовым, чем объектно-ориентированный, - это изучение функциональности cURL в PHP
Существует несколько встроенных в PHP способов доступа к данным HTML через объект DOM, но мой любимый - Simple HTML DOM Parser . Это очень похоже на навигацию по DOM в стиле jQuery / CSS.
$domObject = new Simple_HTML_Dom($html);
foreach ($domobject->find('div#theDataYouWant p') as $sentence)
{
echo "<h3>{$sentence}</h3>";
}