Alexa определенно получает информацию о трафике от пользователей панели инструментов.Поскольку это относительно небольшая группа людей, которые выбирают себя самостоятельно, это неизбежно приводит к необъективной выборке (поэтому трафик Alexa не соответствует измеренному трафику на сайтах, которые я запускаю).Даже с лучшими статистическими методами для уменьшения смещения вы никогда не сможете полностью избавиться от него, когда распределение выборки не является равномерным.
Непонятно, как это делает Google, хотя это может включать отслеживание файлов cookie.
Проект, над которым я недавно работал, имеет отношение к этому вопросу.
Еще один способ сделать это (который также имеет отклонения, но разные) - использовать службу IP to location для определения приблизительной широты и долготы каждого посетителя вашего сайта.Затем используйте мой проект (полное раскрытие: я запускаю этот сайт, и он коммерческий):
http://askgeo.com
Чтобы получить демографическую информацию для этого местоположения.AskGeo фактически предоставляет демографическую информацию на нескольких географических уровнях (штат, округ, районное подразделение, город, почтовый индекс, переписной участок (несколько тысяч человек) и группа блоков переписи (около тысячи человек). Вы, вероятно, захотите использоватьсамый низкий уровень (т. е. группа блоков переписи) для заданной широты и долготы.
Сайт возвращает огромное количество демографических переменных. Идея состоит в том, чтобы использовать мягкие подсчеты из демографических переменных, представленных на уровне группы блоковНапример, если вы пытаетесь отследить возрастное распределение ваших пользователей, то вы будете использовать возрастные диапазоны, указанные в ответе AskGeo, а для данного образца вы добавите дробное мягкое число к каждому диапазону, которыйсоответствует проценту населения в этой группе блоков из соответствующего возрастного диапазона. Например, возьмем мой район в Сан-Франциско. Он имеет следующее распределение по возрасту:
- CensusAgePercent0To4: 7,3%
- CensusAgePercent5To9: 3,5%
- CensusAgePercent10To: 3,2%
... (немного пропуская, как вы, наверное, поняли) ...
- CensusAgePercentOver85: 1,5%
Если вы получили IP-адрес, который вы отслеживали в этой группе блоков переписи, вы добавили бы каждый из этих процентов (в виде доли от 0 до 1) в свои (мягкие) счетчики для этих возрастных диапазонов,(Мягкий счетчик - это просто счетчик, который допускает нецелые числа.)
Вы можете сделать то же самое с расой, полом, уровнем дохода, ценностями дома и т. Д.
Этот метод такжебезусловно, имеет предвзятость, поскольку предполагает, что все люди в данной группе блоков с равной вероятностью посещают ваш сайт.Но это то, что вы можете сделать на своем собственном сайте, а не только в Google и Alexa, и это все равно даст вам относительное ощущение того, кто посещает ваш сайт, если ваши мягкие показатели в данной категории выше, чем в среднем по стране в этой области.категория.
Также возможно, что более сложная техника, чем простые прямые подсчеты, может привести к гораздо более богатому результату.