Как Alexa и Google Analytics отслеживают демографию? - PullRequest
6 голосов
/ 24 августа 2010

Как такие службы, как Alexa и Google Analytics, могут отслеживать возраст посетителей, пол, образование в колледже и т. Д.

http://www.alexa.com/siteinfo/stackoverflow.com

Ответы [ 3 ]

7 голосов
/ 08 мая 2012

Alexa определенно получает информацию о трафике от пользователей панели инструментов.Поскольку это относительно небольшая группа людей, которые выбирают себя самостоятельно, это неизбежно приводит к необъективной выборке (поэтому трафик Alexa не соответствует измеренному трафику на сайтах, которые я запускаю).Даже с лучшими статистическими методами для уменьшения смещения вы никогда не сможете полностью избавиться от него, когда распределение выборки не является равномерным.

Непонятно, как это делает Google, хотя это может включать отслеживание файлов cookie.

Проект, над которым я недавно работал, имеет отношение к этому вопросу.

Еще один способ сделать это (который также имеет отклонения, но разные) - использовать службу IP to location для определения приблизительной широты и долготы каждого посетителя вашего сайта.Затем используйте мой проект (полное раскрытие: я запускаю этот сайт, и он коммерческий):

http://askgeo.com

Чтобы получить демографическую информацию для этого местоположения.AskGeo фактически предоставляет демографическую информацию на нескольких географических уровнях (штат, округ, районное подразделение, город, почтовый индекс, переписной участок (несколько тысяч человек) и группа блоков переписи (около тысячи человек). Вы, вероятно, захотите использоватьсамый низкий уровень (т. е. группа блоков переписи) для заданной широты и долготы.

Сайт возвращает огромное количество демографических переменных. Идея состоит в том, чтобы использовать мягкие подсчеты из демографических переменных, представленных на уровне группы блоковНапример, если вы пытаетесь отследить возрастное распределение ваших пользователей, то вы будете использовать возрастные диапазоны, указанные в ответе AskGeo, а для данного образца вы добавите дробное мягкое число к каждому диапазону, которыйсоответствует проценту населения в этой группе блоков из соответствующего возрастного диапазона. Например, возьмем мой район в Сан-Франциско. Он имеет следующее распределение по возрасту:

  • CensusAgePercent0To4: 7,3%
  • CensusAgePercent5To9: 3,5%
  • CensusAgePercent10To: 3,2%

... (немного пропуская, как вы, наверное, поняли) ...

  • CensusAgePercentOver85: 1,5%

Если вы получили IP-адрес, который вы отслеживали в этой группе блоков переписи, вы добавили бы каждый из этих процентов (в виде доли от 0 до 1) в свои (мягкие) счетчики для этих возрастных диапазонов,(Мягкий счетчик - это просто счетчик, который допускает нецелые числа.)

Вы можете сделать то же самое с расой, полом, уровнем дохода, ценностями дома и т. Д.

Этот метод такжебезусловно, имеет предвзятость, поскольку предполагает, что все люди в данной группе блоков с равной вероятностью посещают ваш сайт.Но это то, что вы можете сделать на своем собственном сайте, а не только в Google и Alexa, и это все равно даст вам относительное ощущение того, кто посещает ваш сайт, если ваши мягкие показатели в данной категории выше, чем в среднем по стране в этой области.категория.

Также возможно, что более сложная техника, чем простые прямые подсчеты, может привести к гораздо более богатому результату.

0 голосов
/ 16 сентября 2013

Alexa получает информацию от панелей инструментов браузера, которые вы устанавливаете специально или как часть пакета с некоторым программным обеспечением.Он задает вопросы, чтобы понять демографические параметры, а также отслеживает сайты, которые вы посещаете.Если вы знаете, что 80% посетителей сайта - женщины, и у вас есть новый посетитель, который посещает этот сайт, вы можете подумать, что существует высокая вероятность того, что этот человек - женщина.Если вы знаете много сайтов, которые посещает этот человек, вы можете многое угадать.

Но, как говорит http://netberry.co.uk/alexa-rank-explained.htm, вы можете полагаться только на информацию из Alexa TOP100,000, потому что тогда у Alexa достаточно информации из небольшихколичество пользователей, посещающих эти сайты.Они говорят "миллионы", но это небольшая доля от общего числа

0 голосов
/ 25 августа 2010

Я провел некоторое исследование, и, очевидно, эти демографические данные отслеживаются так же, как отслеживаются демографические показатели телевизионной аудитории.Есть люди, которые просматривают с помощью своих (Alexa's) панелей инструментов, которые отслеживают посещенные сайты.Эти люди охотно (?) Предоставляют информацию, такую ​​как возраст, пол и т. Д., И Алекса экстраполирует общую демографию из этой выборки.Это, конечно, оставляет место для предвзятости, но это проблема со статистикой.

...