Социальные сети и регистрация использования - PullRequest
0 голосов
/ 24 ноября 2010

Какие данные должны регистрироваться на сайте типа социальной сети с первого дня, чтобы в будущем можно было провести полезный статистический анализ? Кроме того, какие еще советы и хитрости вы изучили при регистрации на сайте? В зависимости от масштаба сайта, стоит ли часто входить в простой файл и периодически выполнять загрузку этих данных в базу данных по соображениям производительности сайта?

Я имею в виду регистрацию на стороне сервера, а не просто ведение журнала Google Analytics / Piwik. Чтобы дать толчок к ответу, вот несколько простых вопросов, о которых я подумал:

  • IP-адрес
  • идентификационная информация пользователя, если залогинен (идентификатор пользователя)
  • HTTP_REFERRER
  • - это вызов ajax (bool)
  • идентификатор сеанса (сеансы также должны постоянно регистрироваться отдельно?)
  • число просмотров с начала сеанса
  • какая-то информация, указывающая, на какой странице находится пользователь (используется контроллер? URL-адрес?)
  • 1020 * Отметка времени *

Ответы [ 4 ]

1 голос
/ 24 ноября 2010

Ну, во-первых, «общая аналитика Google / регистрация типов piwik» на самом деле обычно более мощная, чем обработка журналов на стороне сервера - вы можете устанавливать / получать различные файлы cookie, вы можете извлекать много информации из клиента, доступной только для Javascript, и т. д. и т. д. Даже получение простого cookie visitor_id в Javascript намного проще, чем на стороне сервера - вам нужно настроить какой-либо модуль веб-сервера для отправки сессионных куки, он будет отличаться от стандартных 30 минут WAA и т. д., и т. д. .

Как правило, при разработке переменных / полей для ведения журнала вам нужно подумать о том, какие отчеты / агрегаты вы бы хотели использовать. Например:

  • Кто самый активный пользователь?
  • Какие разделы сайта / страниц / типов страниц в социальной сети наиболее посещаются?
  • Каковы переходы между различными целями, которые вы хотите, чтобы ваши пользователи достигли?
  • Откуда они берутся (особенно полезно, если вы платите за них, то есть с помощью рекламы) и как они достигают целей после этого?
  • Кто предоставляет наиболее полезных (дольше всего просматривают, просматривает большинство ваших объявлений, что-то еще?) Пользователей на ваш сайт?
  • ...

Вопреки распространенному мнению «регистрируйте все, разберитесь позже», ведение журнала - не пассивный, а активный процесс. Скорее всего, вы захотите отправить пользователям файлы cookie, которые пометят их:

  • Идентификаторы сеанса
  • Идентификаторы посетителей
  • Оригинальные источники / источники (т. Е. Внешний источник, поисковая система / запрос, реклама и т. Д.)
  • Количество, частота посещений, продолжительность сеансов
  • Статусы / достижения целей
  • и т.д ...

Все это требует взаимодействия между сервером (и / или фрагментом коллекции Javascript) и браузером посетителя, а не только пассивной регистрации.

0 голосов
/ 20 февраля 2011

PHP-кодировщики сайтов с высоким трафиком должны заглянуть в Scribe.Изначально разработанный в Facebook и с открытым исходным кодом, Scribe - отличный способ регистрировать события в вашем приложении для последующего анализа.Для получения дополнительной информации о писце и других советах ознакомьтесь с этой статьей о ведении журнала для целей анализа .

0 голосов
/ 24 ноября 2010

Журнал каждого запроса (строка запроса и т. Д.).Записать в журнал все переменные HTTP

'HTTP_ACCEPT', 'HTTP_ACCEPT_CHARSET', 'HTTP_ACCEPT_ENCODING', 'HTTP_ACCEPT_LANGUAGE' 'HTTP_CONNECTION', 'HTTP_HOST', 'HTTP_REFERER', 'HTTP_REFERER', 'HTTP_USER3 * * 100 * каждый * возможно 4) каждый с HTTP4request).

Поскольку вас интересует первый день, не беспокойтесь об информации, которая может быть получена из необработанных журналов.Позже вы можете выполнить любую обработку, какую захотите.

Если ресурсы являются ограничением (их не должно быть в начале), вы можете оптимизировать, как хэш для HTTP_USER_AGENT и т. Д.

0 голосов
/ 24 ноября 2010

Как вы, вероятно, уже знаете, регистрируйте слишком много, а не слишком мало.

Если вы регистрируете строку запроса и заголовки всех запросов, у вас должно быть много информации, которую нужно изучить позже.Например.это даст вам большинство вещей, которые вы перечислите выше (или они могут быть вычтены из него).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...