страницы не проиндексированы Google - PullRequest
0 голосов
/ 04 апреля 2011

В моей компании Google Search работает на наших сайтах, индексируя все страницы, насколько я знаю. Я разработал систему документов, которая также индексируется Google. Страницы в системе генерируются динамически, поэтому у меня есть www.mysite.com/doc.aspx?id=234, www.mysite.com/doc.aspx?id=236 и т.д., которые проиндексированы. Дело в том, что некоторые случайные страницы (скажем, www.mysite.com/doc.aspx?id=235) не индексируются по неизвестной причине. Куда мне обратиться, чтобы решить эту проблему? Есть идеи?

Ответы [ 4 ]

6 голосов
/ 05 апреля 2011

вот краткое и очень упрощенное описание того, как Google обрабатывает ваш сайт (ы)

discovery -> crawling -> indexing -> ranking (->feedback)

discovery : это процесс поиска страниц вашего сайта в Google.), это можно сделать либо по ссылкам в html, либо через sitemap.xml (и URL-адреса в фидах на странице javascript, rss или atom, ... практически любой URL-адрес, который может найти Google)

сканирование: процесс Google, извлекающий содержимое обнаруженного URL-адреса (и помещающий вновь найденные URL-адреса в очередь обнаружения)

индексирование : сохранение обнаруженного и просканированного содержимого в их базе данных иделая его доступным для поиска

ранжирование : сопоставление индексированного содержимого с запросом пользователя и - если это достаточно важно - возвращение его в виде видимой выдачи SERP для пользователя.

обратная связь на основе поведения щелчка / отсутствия щелчка и данных, собранных из других источников (предполагаемые данные ISDN и панель инструментов Google, отчеты браузера Chrome и т. Д.)но поведение пользователя в его serp (и после щелчка).

  • между каждым шагом - множество показателей качества (последний шаг - просто этап сбора показателей качества).
  • каждый шаг возвращает к предыдущим шагам.

, поэтому, в принципе, даже если вы сообщаете все свои URL-адреса в Google (т. Е. Через sitemap.xml), Google не обязательно сканирует все ваши URL-адреса.или индексировать или оценивать их как видимые.

хорошо, так что же это за низко висящие фрукты , чтобы получить больше страниц в индексе (где они, по крайней мере, имеют шанс что-то оценить)?

  • передает ровно один URL на страницу (используйте перенаправления http 301, канонический тег и убирайте все ссылки в Интернете)
  • сделайте ваш сайт быстрее (огромное влияние)
  • сделать его более легким в КБ (приятный эффект, в основном потому, что он тоже быстрее)
  • размещать больше уникального контента на ваших страницах.
  • предотвращать дублирование контента
  • внешний (от другихвеб-сайты) ссылки наваши страницы (важно не общее количество, а стабильный рост во времени)

ps: просто как примечание - шаг сканирования является необязательным.даже не просканированные URL-адреса (т. е. если они были заблокированы с помощью robots.txt) могут быть проиндексированы (и ранжированы), но это не очень распространено

0 голосов
/ 04 апреля 2011

Я согласен с Даниилом.Вам нужна страница со списком ссылок.Или страница со ссылками на нумерацию страниц.

Но URL-адреса динамического кода вредны для SEO, лучший способ - это дружественный URL-адрес.Посмотрите на ISAPIRewrite или Routing.

Надеюсь, это поможет вам.

0 голосов
/ 04 апреля 2011

Не все страницы проиндексированы, механизм индексирования просто считает некоторые страницы неинтересными. На нашем сайте около 80% страниц проиндексированы, и это считается очень хорошим для сайта такого типа, очень немногие сайты имеют более высокий показатель.

Как отметил Даниэль, наличие ссылок на страницу имеет решающее значение, иначе ее вообще не будет найдено. Тогда страница должна иметь некоторую информацию, которая является уникальной для этой страницы, и, предпочтительно, уникальный заголовок, или она может быть классифицирована как дубликат.

0 голосов
/ 04 апреля 2011

Afaik, страницы не индексируются, если они не связаны с другими страницами.Может быть, ни одна страница не ссылается на неиндексированные страницы?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...