Хотя обычно вам не следует анализировать HTML-файл с помощью регулярных выражений, в этом случае вы можете сделать исключение (поскольку на странице, в частности, все еще используется <font>
, структура все равно нарушается, и синтаксический анализатор XML мало чем поможет). Этот фрагмент кода предполагает, что вы уже загрузили веб-страницу и поместили ее в строковую переменную $webpage_as_string
:
preg_match('|Results.+?of +about +\<b\>([0-9,]+)\<\/b\> +for|', $webpage_as_string, $matches);
$matches[1]
будет содержать результат в виде строки. Вам нужно отфильтровать запятые и разобрать их в число ... Конечно, этот код сломается, как только Google изменит шаблон своего сайта.
http://php.net/manual/en/function.preg-match.php содержит больше информации о функции, руководство по шаблону здесь: http://www.php.net/manual/en/reference.pcre.pattern.syntax.php