Как получить название статьи с помощью регулярных выражений? - PullRequest
1 голос
/ 15 августа 2011

Я хочу получить заголовок статьи с этой страницы, используя regex и simplehtmldom: http://laperuanavegana.wordpress.com/about/

в данном случае название: Cómo preparar SEITÁN

Вот мое регулярное выражение:

$html = file_get_html($url);
preg_match_all("title=(.*?)",$html->innertext,$title);
echo "this is title ".$title[0][0]."<br>";

Было бы полезно, если бы кто-нибудь помог мне найти ошибку.

1 Ответ

2 голосов
/ 15 августа 2011

Я думаю, вам нужно искать текст между <title> и </title>, а не текст, следующий за title=.

Например:

$html = "Sometext<title>Seitan</title>More text";
preg_match_all('|<title>(.*?)</title>|',$html,$title);
echo "this is title ".$title[1][0]."<br>";
...