Есть ли причина, по которой такие сайты, как Facebook / Digg / Reddit, не будут анализировать правильные метатеги на странице для заголовка / описания? - PullRequest
0 голосов
/ 26 июня 2010

Любая статья на нашем сайте имеет метатеги для заголовка, описания, изображения и ключевых слов в элементе head, но по какой-то причине ни один из сайтов новостных агрегатов не вытянет ни одного из них.

http://darthhater.com/2010/06/25/friday-update-preview http://darthhater.com/2010/06/24/official-bioware-stance-on-game-testing-leaks

Не пытается опубликовать рекламу. У нас действительно есть проблема. Ссылка «Поделиться» находится в правом нижнем углу статьи со ссылками на Facebook, Digg и Reddit. Жаль, что ни один из них не предоставляет системы отладки, чтобы выяснить, почему вещи неправильно добавляются в их систему.

Я думаю, что это может быть связано со сжатием gzip сайта, или, может быть, из-за того, что синтаксический анализатор PHP XSL выводит сайт в формате XML (я удаляю стартовый тег программно, но даже если для XSL установлено значение «html» проблема сохраняется. Я подумал, что, возможно, это связано с лишением пробелов или порядком метатегов (я знаю, это смешно). Это немного раздражает, и если я помещаю наши URL-адреса в средства проверки SEO, такие как seocentro.com он находит все метатеги просто отлично, так что, очевидно, это не ошибка разбора страницы на их конце.

1 Ответ

0 голосов
/ 26 июня 2010

Мой выстрел в темноте заключается в том, что у вас есть head часть в одной огромной строке:

<html xmlns="http://www.w3.org/1999/xhtml" xmlns:magasi="http://www.magasi-php.com/" xmlns:php="http://www.w3.org/1999/XSL/Transform"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /><meta name="title" content="Friday Update Preview" /><meta name="description" content="Sean Dahlberg, Star Wars: The Old Republic Community Manager, informs the community that tomorrow's update will be a late one:  Just wanted to let everyone kno..." /><link rel="image_src" href="http://darthhater.com/images/fbimage.jpg" /><meta name="keywords" content="Friday Preview,Sean Dahlberg" /><link rel="alternate" type="application/rss+xml" title="Darth Hater - A Star Wars: The Old Republic Community RSS Feed" href="http://darthhater.com/feed/" /><link type="text/css" rel="stylesheet" href="/styles/DarthHater/style/main.css" /><script type="text/javascript" language="javascript">

это, вероятно, допустимый HTML, но я не удивлюсь, если парсер захлебнется им.

Кроме того, у вас 438 ошибок проверки . Вероятно, это не ваша проблема, поскольку в основном это мелочи, и парсеры должны иметь возможность иметь дело с неверным HTML, но никто не знает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...