CodeIgniter: класс / библиотека, чтобы помочь получить мета-теги с веб-страницы? - PullRequest
2 голосов
/ 16 февраля 2010

Я использую codeigniter. Я думаю, не имеет значения, какой php framework я использую.

Но прежде, чем я напишу свой собственный класс, есть еще один, который уже написан, который позволяет пользователю получить заголовок страницы и метатеги (ключевые слова, описания) любого сайта ... если они есть.

Любой класс PHP, который делает это, был бы великолепен.

Спасибо всем

Ответы [ 5 ]

4 голосов
/ 16 февраля 2010

Вы должны взглянуть на этот класс: PHP Simple HTML DOM работает следующим образом:

<code>include('simple_html_dom.php');
$html = file_get_html('http://www.codeigniter.com/');

echo $html->find('title', 0)->innertext; // get <title>

echo "<pre>";
foreach($html->find('meta') as $element)
       echo $element->name . " : " . $element->content  . '<br>'; //prints every META tag

echo "
";
1 голос
/ 06 июля 2010

с DOM / xpath

libxml_use_internal_errors(true);
$c = file_get_contents("http://url/here");
$d = new DomDocument();
$d->loadHTML($c);
$xp = new domxpath($d);
foreach ($xp->query("//meta[@name='keywords']") as $el) {
    echo $el->getAttribute("content");
}
foreach ($xp->query("//meta[@name='description']") as $el) {
    echo $el->getAttribute("content");
}
1 голос
/ 16 февраля 2010

Вы можете получить все метатеги с удаленной страницы с помощью get_meta_tags - http://ca3.php.net/get_meta_tags

эта страница имеет класс для получения страницы и описания, они также используют get_meta_tags - http://www.emirplicanic.com/php/get-remote-page-title-with-php.php

Вы должны быть в состоянии объединить биты из обоих, чтобы получить все, что вам нужно.

1 голос
/ 16 февраля 2010

Смотрите это, пожалуйста. Это универсальный класс для получения мета-тегов страницы и выполнения гораздо большего. Посмотрите, можете ли вы добавить это в библиотеку codeigniter. Спасибо

1 голос
/ 16 февраля 2010

Используйте библиотеку PHP curl. Он может извлекать другие страницы из Интернета и извлекать их как строки, а затем вы можете проанализировать строку с помощью регулярных выражений, чтобы найти заголовок страницы и метатеги.

...