Игнорирует ли Google то, что находится после фрагмента хэша (#) при сканировании нашего сайта? - PullRequest
5 голосов
/ 14 мая 2011

Мы используем информацию, которая находится после фрагмента хеша, для отображения разных страниц с использованием JavaScript, чтобы браузер не загружал всю страницу снова.Например, прямая ссылка на страницу может выглядеть следующим образом (book_id / page_id):

www.example.com/book#1234/5678

Поскольку у нас нет прямых ссылок на каждую страницу, но на книги, мы думаем добавить эти прямыессылки на sitemap.xml.

Мой вопрос заключается в том, Google рассматривает это как отдельную ссылку или просто игнорирует все, что находится после фрагмента хеша, во время обычного сканирования или если мы включаем его в карту сайта.XML

Ответы [ 2 ]

7 голосов
/ 16 мая 2011

, как отмечает Lucero, часть хеш-фрагмента (#1234/5678) «URL-адресов AJAX» не отправляется на сервер как часть HTTP-запроса (по спецификации) - поэтому сервер будет возвращать один и тот же результат для всех вашихразличные URL-адреса AJAX.

К счастью, существует схема , которая позволяет googlebot сканировать и индексировать даже страницы AJAX :

Step-пошаговое руководство

  1. Укажите сканеру, что ваш сайт поддерживает схему сканирования AJAX
    (помечая уникальные состояния страниц, которые вы хотите, чтобы googlebot сканировал специальными фрагментами хешаначинающиеся с восклицательного знака, например #!1234/5678)
  2. Настройте сервер для обработки запросов на URL-адреса, содержащие «_escaped_fragment _»
    (www.example.com/book?_escaped_fragment_=#1234/5678), и возвращайте html-снимок состояния этой страницы
  3. ...
1 голос
/ 14 мая 2011

Технически, # часть предназначена только для якорей на стороне клиента.Он не отправляется на сервер и не имеет значения для URL как такового, поэтому я предполагаю, что Google видит это все как одну и ту же ссылку.

Хотя вам может быть полезна следующая информация: http://www.searchenginepeople.com/blog/how-to-track-clicks-on-anchors-in-google-analytics.html

...