mod_rewrite и избыточные / старые URL-адреса, требуются некоторые рекомендации по SEO - PullRequest
1 голос
/ 19 июня 2010

Посмотрите, как Google воспринимает наш сайт в данный момент, и в скором времени ... В основном, мы используем стандартную структуру переписывания URL, чтобы они выглядели оптимизированными для SEO.

например, URL продукта принимает форму any string_([0-9]).html и так далее. конечно, это позволяет нам ссылаться на все, что мы хотим, перед идентификатором продукта ... который мы сделали. В прошлом страница продукта была Product_Name_79.html, а затем стала Brand_Name_Product_Name_79.html. apache на самом деле не волнует, и id 79 передается в любом случае. Тем не менее, в Google теперь есть 2 версии этого продукта, которые кэшируются под разными URL-адресами - и это не очень хорошая вещь, так как он продолжает приходить к первому URL-адресу и пауковать его.

То же самое относится к нашим правилам переписывания для брендов и категорий, некоторые из которых были удалены, а некоторые были изменены.

в site:domain содержится более 11 тысяч URL, тогда как наша карта сайта получает только 5,8 тысяч. как бы вы запретили паукам получать старые версии URL-адресов, на которые вы больше не ссылаетесь (учитывая, что это не ручной процесс, и часто такие URL-адреса могут быть очень динамичными).

Например, Mens_Merrell_Trail_Running_Shoes__50-100__10____024/ - это динамический URL-адрес для бренда merrell, суженный по элементам в trail running shoes, которые стоят от 50 and 100 до size 10 с полом, установленным на men's.

если мы решим nofollow URL-адреса фильтров любого размера и денег, это оставляет Google по-прежнему возможность доступа к ним через старый кеш ...

Какова лучшая практика для запрета определенного типа URL? Поскольку приведенные выше комбинации почти бесконечны, я не могу составить список, и его нельзя сопоставить с тем, какие бренды и категории Google могли хранить для нас исторически.

добавим ли мы noindex при применении таких фильтров? мы экспортируем их в robots.txt? ничего не делать в надежде, что гугл перестанет возвращаться?

Если посмотреть в перспективе, у нас есть 2600 URL-адресов страниц продуктов, которые теперь избыточны / отключены. Что бы вы сделали с ними? перенаправление на домашнюю страницу, на страницу бренда, 404, ничего не делать?

спасибо за любой совет

Ответы [ 2 ]

2 голосов
/ 21 июня 2010

Я думаю, что вы ищете rel = "canonical" , Google должен начать игнорировать ваши ссылки, если они действительно не связаны с.Вы можете проверить любые входящие ссылки с помощью инструмента, подобного следующему: http://www.seomoz.org/linkscape.

Также, если ваши старые URL-адреса соответствуют (или не соответствуют) последовательному шаблону, вы можете установить перенаправление 301 в apache либостраницы, соответствующие старому шаблону или не соответствующие новому шаблону ...

надеюсь, это поможет!

0 голосов
/ 10 мая 2017

Обязательно настройте перенаправления для любого URL, который вы меняете.Кроме того, я не рекомендую использовать rel = nofollow, поскольку это указывает Google, что ваш сайт не заслуживает доверия.

...