Как измерить статистическую значимость рейтинга кликов? - PullRequest
5 голосов
/ 08 марта 2011

Я создаю проект с открытым исходным кодом, который будет измерять, являются ли различия в показателях кликов в различных рекламных объявлениях на Facebook значительными. Вдохновившись http://adwords.google.com/support/aw/bin/answer.py?hl=en&answer=167743, я написал следующий код ruby ​​(предположим, что любые методы, не определенные внутри, делают именно то, что говорят)

Коэффициент кликов определяется как процент людей, кликнувших по объявлению, по сравнению с количеством людей, которые увидели показ этого объявления.



  # ** exponentiation
  # * multiplication
  # / division
  def standard_deviation
    (experiment_ctr/(control_ctr**3) * (no_of_clicks_for_control +
                                        no_of_clicks_for_experiment - product_of_ctrs *
                                        total_no_of_impressions ) / product_of_impressions) ** 0.5
  end

 def z_score
   (ratio_of_experiment_ctr_to_control - 1) / standard_deviation
  end


Я скопировал код стандартного отклонения с веб-сайта Google, но он мне кажется подозрительным. У кого-нибудь есть идеи относительно того, правильно ли это или нет?

Очень ценится.

1 Ответ

2 голосов
/ 22 марта 2011

Это не выглядит знакомым, потому что это не обычные тесты значимости, которые привыкли видеть большинство людей.Наиболее значимый критерий формулируется следующим образом: (в общем, не обобщенно, пожалуйста, не указывайте пламя):

  1. вычисление выборочной статистики, X
  2. определение ожидаемого значения этой статистики, E
  3. определить стандартное отклонение этой статистики, S
  4. вычислить статистику теста T = (X - E) / S
  5. определить, является ли значение T значительным, исходя из предположенного распределения T.

Для общих тестов среднего значения E - среднее значение выборки, а S - стандартное отклонение выборки, с которым мы наиболее знакомы.

Этот тест значимости основан на некотором соотношении для статистики выборки.,Формула (EC) / C предоставлена ​​Google.Эта статистика, согласно Google, имеет ожидаемое значение (1 / (1-p)) - 2 и имеет стандартное отклонение (p / ((C + E) * (1-p) ^ 3)) ^ 0.5,Таким образом, это должны быть числа, включенные в формулу T выше.Z-оценка в объяснении Google.

Итак, хотя формула выглядит странно, она основана на основополагающих принципах.Вы должны быть в состоянии использовать это с уверенностью.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...