Как платформы веб-аналитики (например, GA) рассчитывают уникальных посетителей? - PullRequest
2 голосов
/ 09 мая 2009

Подсчет отдельных посетителей - задача не из легких. Например, в веб-аналитике посетитель может посетить в понедельник и четверг, но при подсчете уникальных посетителей за эту неделю я бы рассчитывал подсчитать этого посетителя только один раз.

count (distinct userid) для 10 миллионов посещений в течение месяца не может выполняться слишком быстро, поскольку агрегации не могут быть применены (поскольку подсчет различных значений не является «добавляемой» мерой).

Мой вопрос: как Google Analytics и другие платформы веб-аналитики так быстро возвращают уникальных посетителей? Я предполагаю, что используются статистические оценки. Какие? Как?

Ответы [ 2 ]

0 голосов
/ 19 июля 2013

См. Этот пост для обзора вероятностных подходов http://highlyscalable.wordpress.com/2012/05/01/probabilistic-structures-web-analytics-data-mining/, которые можно использовать для подсчета уникальных чисел

0 голосов
/ 09 мая 2009

Они устанавливают куки с разумным сроком действия. Если у вас уже есть файл cookie, вы вернулись.

...