Question

Я пытаюсь извлечь цену из приведенной ниже html-страницы / ссылки, используя php cURL и preg_match. В основном я ожидаю, что этот код выведет 4550, но по некоторым причинам я получаю

 Notice: Undefined offset: 1 in C:\wamp\www\test.php on line 22

Я думаю, что шаблон правильный, потому что, если я помещаю html сам в переменную и экранирую "", это работает! , Также, если я выведу (echo $ result;), он отобразит html, правильно полученный с веб-сайта foxtons, поэтому я просто не могу понять, почему все это не работает. Мне нужно сделать это, и я был бы признателен, если бы вы сказали мне, почему генерируется это уведомление и почему мой текущий скрипт не работает.

$url = "<a href="http://www.foxtons.co.uk/search?bedrooms_from=0&property_id=727717" rel="nofollow noreferrer">http://www.foxtons.co.uk/search?bedrooms_from=0&property_id=727717</a>";
$ch = curl_init($url);</p>

<p>curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch,CURLOPT_RETURNTRANSFER, 1); 
$result = curl_exec($ch);
curl_exec($ch);
curl_close($ch);
$result2 = str_replace('"', '\"', $result);</p>

<p>$tagname1= ");</script>
    ";
 $tagname2= "</noscript> 
    per month</a>";</p>

<code>$pattern = "/$tagname1(.*?)$tagname2/";
preg_match($pattern, $result, $matches);
$prices = $matches[1];

print_r($prices);

?>
</code>

Pedro Lobito · Answer 1 · 09 августа 2011

Не используйте REGEX для анализа html , вместо этого используйте html dom-парсер, например PHP Simple HTML DOM Parser

include("simple_html_dom.php") ;

$html = file_get_html("http://www.foxtons.co.uk/search?bedrooms_from=0&property_id=727717");

foreach($html->find('noscript') as $noscript)
{

    echo $noscript->innertext."<br>";
}

Эхо:

Geek Num 88 · Answer 2 · 15 мая 2010

Я немного переписал скрипт, чтобы учесть более 1

на странице. Вам нужно было использовать preg_match_all, который будет искать все совпадения, а не останавливаться только на первом.



$url = "http://www.foxtons.co.uk/search?bedrooms_from=0&property_id=727717";
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch,CURLOPT_RETURNTRANSFER, 1);
$result = curl_exec($ch);
curl_exec($ch);
curl_close($ch);

preg_match_all("/<noscript>(.*)<\/noscript>/", $result, $matches);
print_r($matches);

Выходы



Array
(
    [0] => Array
        (
            [0] => &pound;1,050
            [1] => 4,550
        )

    [1] => Array
        (
            [0] => &pound;1,050
            [1] => 4,550
        )

)

Я попробовал это на своей коробке, и это сработало - дай мне знать, сработало ли это для тебя

php cURL.preg_match, извлекать текст из xhtml

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

php cURL.preg_match, извлекать текст из xhtml

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы