Как извлечь строку из следующей HTML-страницы с помощью PHP - PullRequest
0 голосов
/ 15 июля 2011

Застрял в некоторых вещах.Короче говоря, мне нужно извлечь некоторые данные с веб-страницы.По сути, мне нужно извлечь / title / tt0118615 / из

<a href="/title/tt0118615/" onclick="(new Image()).src='/rg/find-media-title/media_strip/images/b.gif?link=/title/tt0118615/';">Anaconda</a>"

, используя preg_match () или любым другим способом.Это фрагмент кода со страницы, который извлекается с помощью приведенного ниже php-кода:

 <?php
$url = "http://www.imdb.com/find?s=tt&q=Anaconda";
$raw = file_get_contents($url);
echo preg_match ("/^(href=\"\/title\/tt)\"$/", $raw, $data);
echo "data: $data[1]";
?>

Я знаю, что ошибаюсь в паттерне, поэтому я публикую свой вопрос здесь.Заранее спасибо.

Ответы [ 2 ]

0 голосов
/ 17 августа 2011
$url = "http://www.imdb.com/find?s=tt&q=Anaconda";
$raw = file_get_contents($url);

preg_match_all('%b\.gif\?link=(/title/.*?)\'%i', $raw, $imdbcode, PREG_PATTERN_ORDER);
$imdbcode = $imdbcode[1][0];
echo $imdbcode; #echo's  /title/tt0118615/
0 голосов
/ 15 июля 2011

Я думаю, что этот шаблон будет работать в вашем случае:

preg_match("/a href=\"([^\"]*)\"/", $raw, $data);

$ data будет массивом, содержащим ваши результаты, $ data [1] - тот, который вы ищете

...