Подсчет отдельных посетителей - задача не из легких. Например, в веб-аналитике посетитель может посетить в понедельник и четверг, но при подсчете уникальных посетителей за эту неделю я бы рассчитывал подсчитать этого посетителя только один раз.
count (distinct userid)
для 10 миллионов посещений в течение месяца не может выполняться слишком быстро, поскольку агрегации не могут быть применены (поскольку подсчет различных значений не является «добавляемой» мерой).
Мой вопрос: как Google Analytics и другие платформы веб-аналитики так быстро возвращают уникальных посетителей? Я предполагаю, что используются статистические оценки. Какие? Как?