Как поисковые системы видят динамические профили? - PullRequest
1 голос
/ 02 июня 2010

В последнее время поисковые системы смогли размещать динамический контент на сайтах социальных сетей. Я хотел бы понять, как это делается. Существуют ли статические страницы, созданные таким сайтом, как Facebook, которые обновляются почти так же часто? Google пытается сохранить каждое возможное имя пользователя?

Насколько я понимаю, страница, такая как www.facebook.com/username, не является реальным файлом, хранящимся на диске, но является сокращением для запроса типа: выберите имя пользователя из списка пользователей и отобразите информацию на странице. Как Google знает о каждом пользователе, это становится еще сложнее, когда такие вещи, как твиты.

РЕДАКТИРОВАТЬ: Я думаю, я действительно не спрашивал, что я хотел знать. Нужно ли мне быть таким же большим, как твиттер или фейсбук, чтобы Google мог особым образом сканировать мой сайт? Будет ли Google автоматически находить мои профили пользователей, если я позволю кому-либо просматривать их? Если нет, что мне нужно сделать, чтобы это сработало?

Ответы [ 3 ]

4 голосов
/ 02 июня 2010

В частности, в случае с твитами Google не «сканирует» их в традиционном смысле; они интегрированы с Twitter для предоставления результатов поиска в режиме реального времени.

В более общем случае вашего вопроса, динамический контент не является новым для Facebook или Twitter, хотя может показаться, что это так. Google сканирует URL; URL предоставляет данные HTML; Google индексирует это. Будь то динамический запрос, отображающий страницу, или это кэш статического HTML, в теории мало что меняет процесс индексирования . На практике это намного больше (см. Комментарий Майкла Б. .)

И посмотрите краткий пост Vartec о том, как Google может найти все эти общедоступные профили в Facebook, не заходя и не копаясь в FB.

Хорошо, это было значительно упрощено, но давайте посмотрим, что еще люди скажут ..

1 голос
/ 02 июня 2010
  1. профили могут быть связаны извне;
  2. сайт может предоставить карту сайта
1 голос
/ 02 июня 2010

Насколько я знаю, Google не может читать и хранить фактическое содержимое профилей, потому что бот Google не имеет учетной записи Facebook, и это будет серьезным нарушением конфиденциальности.

Бот работает, нажимая facebook.com, а затем переходя по каждой ссылке, которую он может найти. Любой контент, который он видит на странице, которую он посещает, он сохраняет. Поэтому, даже если он следует динамическому URL-адресу, например www.facebook.com/username, он будет просто помнить все, что видел, когда туда заходил. Надеемся, что в этом конкретном случае это не все личные данные указанного пользователя.

Кроме того, Facebook может и действительно предоставляет специальные инструкции, которым могут следовать поисковые роботы, чтобы результаты Google не включали несколько страниц входа в систему.

...