У меня есть два связанных вопроса по статистике населения.Я не статистик, но был бы признателен за указатели, чтобы узнать больше.
У меня есть процесс, который получается в результате подбрасывания трехсторонней монеты (результаты: A, B, C), и я вычисляю статистику t=(A-C)/(A+B+C)
,В моей задаче у меня есть набор, который случайным образом делится на наборы X и Y, возможно, равномерно, а может и нет.Я вычисляю t для X и Y. Я хочу знать, является ли различие, которое я наблюдаю в этих двух значениях t, случайным или нет.
Теперь, если бы это было простое биномиальное распределение (т.е. япросто посчитав, кто попал в X или Y), я бы знал, что делать: я вычисляю n=|X|+|Y|
, σ=sqrt(np(1-p))
(и я предполагаю, что p=.5
), а затем сравниваю с нормальным распределением.Так, например, если бы я наблюдал |X|=45
и |Y|=55
, я бы сказал σ=5
, и поэтому я ожидаю, что это отклонение от среднего μ=50
будет случайным в 68,27% случаев.С другой стороны, я ожидаю большего отклонения от среднего в 31,73% случаев.
Существует промежуточная проблема, которая также интересует меня и которая, как мне кажется, может помочь мне понять основную проблему, где я измеряю некоторые свойства членовA и B. Скажем, 25% по A положительны и 66% по B положительны.(A и B не имеют одинакового количества элементов - процесс выбора не одинаков.) Я хотел бы знать, ожидаю ли я эту разницу случайно.
В качестве первого черновика я вычислил t
как будто это было измерение монетных бросков, но я почти уверен, что это не совсем правильно.
Есть какие-нибудь указатели на то, как правильно моделировать это?