Откуда Google получает реферат для каждого из результатов своего сайта, который он отображает на своей странице результатов поиска? - PullRequest
3 голосов
/ 06 октября 2011

Я работаю над проектом, в котором мне нужно искать термины в поисковой системе , а затем группировать результаты по их контекстуальному смыслу .Поэтому я должен рассматривать каждый результат как документ.к сожалению, данные, представленные вместе с каждым результатом на странице результатов, слишком малы для кластеризации.Следовательно, я хотел знать, откуда поисковые машины получают реферат для каждого результата, который они показывают .Если бы я мог получить весь этот реферат, то я мог бы сгруппировать результаты, рассматривая их как отдельные документы.

Откуда Google получает реферат?Например: если вы ищете "1000 Mile" в Google, второй результат показывает следующее резюме: "Женская коллекция 1000 Mile основана на классическом дизайне и отражает долгое наследие Wolverine в создании качественной обуви. В дополнение к этой классике ..."

Данный реферат отсутствует в метатегах страницы.

Откуда Google находит эти данные.

Спасибо

Ответы [ 2 ]

3 голосов
/ 06 октября 2011

С Использует ли Google мета-тег описания для описания страницы?

Google будет выбирать фрагменты результатов поиска из следующих мест (необязательно в этом порядке):

  1. Мета-тег описания страницы
  2. Список страниц Open Directory Project (ODP)
  3. Содержимое страницы, относящееся к поисковому запросу

Если выЕсли не хотите, чтобы Google использовал описание листинга ODP, вы можете запретить ему использовать следующий метатег:

<meta name="robots" content="NOODP">

Если вы хотите, чтобы Google использовал ваш метатегЗатем добавьте тег описания, чтобы убедиться, что он уникален для каждой страницы.Также убедитесь, что оно содержит точное описание содержимого страницы.

В отсутствие описания ODP и тега Meta Description Google будет использовать часть текста страницы в качестве описания.Этот текст будет содержать наиболее близкие совпадения с поисковым запросом.Я не видел какого-либо официального ограничения на то, как долго это может быть, но пара предложений кажется правильной.

В соответствующей заметке, если вы не хотите, чтобы фрагмент отображался на определенной странице, вы можетеиспользуйте следующий метатег, чтобы не показывать его:

<meta name="robots" content="nosnippet">

См. эту запись в блоге , где приведены советы Google по использованию мета-тега описания.

Согласно this site , "Мета-описание обычно должно содержать не более от 145 до 150 символов в длину, так как это максимальное количество символов, обычно отображаемое в Yahoo! И Google соответственно".

0 голосов
/ 06 октября 2011

Этот сайт основан на Flash, и Google может индексировать содержимое Flash * , так как фрагмент не находится в исходном HTML-коде страницы, как вы указали, равно как и в кэшированной версии. страницы, я предполагаю, что это где-то во флэш-фильме.

Это довольно произвольно, когда во фрагменте упоминается «Женская коллекция 1000 миль», в то время как сама ссылка на сайт относится к родительской категории 1000 миль, а не только к женской, поэтому я предполагаю, что сбор метаданных, дружественных к фрагментам, Флэш-сайт - неточная наука. Это мое лучшее предположение.

В этом блоге Google Webmaster они объясняют, как они используют внешний текст или файлы HTML, загруженные во Flash-ролик, и в одном из комментариев Джонатан Саймон говорит (извините):

"Мы стараемся сканировать Flash-контент, но результаты иногда могут быть не идеальными. Вы видите только заголовок в результатах поиска для своего сайта, потому что это единственный фрагмент HTML-текста, который у вас есть за пределами вашего содержимого Flash. Вы можете добавить элемент мета-описания, чтобы предложить больше информации в HTML. Вы также можете добавить другой текст, который не является частью вашего содержимого Flash. Просто выполнение этого должно улучшить фрагмент, который вы видите, связанный с вашим сайтом в Результаты поиска. "

...