Соскребая данные с NHL.com - PullRequest
0 голосов
/ 16 ноября 2011

Я пытаюсь получить таблицу из http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA, и сохранить ее в базе данных MySQL на моем сервере.Используя ниже, я могу точно скопировать сайт, но я не уверен, как просто извлечь эту таблицу.Код ниже:

Есть идеи?

function get_data($url)
{
  $ch = curl_init();
  $timeout = 5;
  curl_setopt($ch,CURLOPT_URL,$url);
  curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
  curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
  $data = curl_exec($ch);
  curl_close($ch);
  return $data;
}

$returned_content = get_data('http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA');

echo $returned_content;

ОБНОВЛЕНИЕ:

$html = file_get_html('http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA');
    $e = $html->find("table", 2);

    echo($e);

Этот код работает, публикует таблицу, как мне нужно,Но теперь мне любопытно, как мне удалить все ненужные ссылки / форматирование и сохранить их в базе данных?

Ответы [ 2 ]

0 голосов
/ 15 октября 2015

В электронных таблицах Google все мои функции importhtml для nhl.com не работают в этом году. Я думаю, что они (по какой-то причине) не позволяют пользователям очищать свои данные.

0 голосов
/ 16 ноября 2011

Попробуйте поработать с этой библиотекой http://simplehtmldom.sourceforge.net/

...