Получить заголовок и метатеги любого сайта на любом языке с помощью PHP - PullRequest
1 голос
/ 03 августа 2011

Я хочу попробовать выяснить, как получить заголовок и все метатеги с веб-страницы

<title>A common title</title>
<meta name="keywords" content="Keywords blabla" />
<meta name="description" content="This is the description" />

Этот вопрос, кажется, задавался и отвечался несколько раз в stackoverflow, но ни один ответ не заботит язык / кодировка веб-страницы. Например, скрипт shamittomar здесь Получение заголовка и метатегов с внешнего сайта работает только для веб-страницы в utf-8. Этот скрипт не работает, например, он вернет странный результат для этих сайтов:

http://www.tudou.com/

http://svmpbt.com/

(примечание: вышеуказанные сайты не мои, а только примеры)

Есть ли способ сделать это правильно, есть ли доступный класс для этого? Поскольку Facebook Linter корректно работает с вышеуказанными сайтами, я думаю, что в PHP-скрипте есть доступное решение.

Спасибо.

1 Ответ

0 голосов
/ 11 октября 2011

Вы должны использовать функцию "get_meta_tags" в php, она предоставляет заголовок, описание и ключевое слово.для этого обратитесь по этой ссылке: http://php.net/manual/en/function.get-meta-tags.php
И если вам нужна дополнительная информация, вы также можете использовать метод file_get_contents, который вернет вам источник этого URL, затем проанализирует его и извлечет соответствующую информацию.Ссылка на эту ссылку: http://in2.php.net/manual/en/function.file-get-contents.php

...