SEO, заказ и дублирование контента - PullRequest
1 голос
/ 16 мая 2010

Я управляю специализированным новостным сайтом и пытаюсь добавить немного соуса для SEO. Одна из самых важных вещей, которые я слышу, - это избегать дублирования контента. Я охватил все основы, но я застрял с упорядочением контента.

Например, архив сайта можно упорядочить по дате, просмотрам и рейтингу. Поскольку у нас не так много новостей, на странице архива за определенный день обычно есть только пара элементов, поэтому все следующие URL имеют одинаковое содержание, хотя и в разном порядке:

  • / Новости / Архив / 2010/05/16 /
  • / Новости / Архив / 2010/05/16 /? О = вид
  • / Новости / Архив / 2010/05/16 /? О = оценка

Наказывают ли поисковые машины данный тип дублирования контента? И если да, каков наилучший способ избежать указанного штрафа? <link rel="canonical" />? Скажите Google & Co. о необходимости ввода параметра o? Отметить ссылки для заказа с помощью nofollow? Разрешить только индексацию упорядоченных по дате архивных сайтов через robots.txt (не уверен, если это вообще возможно)?

Ответы [ 3 ]

1 голос
/ 17 мая 2010

Если у вас есть динамический URL, который находится в стандартный формат как foo? key1 = value & key2 = value2 we рекомендую оставить ссылку без изменений, и Google будет определять какие параметры можно удалить

http://googlewebmastercentral.blogspot.com/2008/09/dynamic-urls-vs-static-urls.html

По сути, Google не заботится об этом. Робот Google достаточно умен, чтобы решить эту проблему для вас.

Я всегда использую канонический тег, мне кажется чище.

0 голосов
/ 25 февраля 2013

Перейдите в Инструменты для веб-мастеров Google> Конфигурация> Параметры URL-адреса и настройте параметр "o" как сортирующий контент.

0 голосов
/ 16 мая 2010

Я не знаю, влияет ли это на рейтинг в поисковых системах или нет (вероятно, влияет). В Google Webmaster вы можете указать, какие параметры строки запроса следует игнорировать (см. Конфигурация сайта / Настройки). Вы также можете добавить это в robots.txt:

User-agent: *
/news/archive/*/*/*/?*o=

Это блокирует сканер, даже если у вас есть другие параметры запроса, как в

/news/archive/2010/05/16/?direction=asc&o=date
...