Подбрасывание трехсторонней монеты - PullRequest
0 голосов
/ 10 декабря 2018

У меня есть два связанных вопроса по статистике населения.Я не статистик, но был бы признателен за указатели, чтобы узнать больше.

У меня есть процесс, который получается в результате подбрасывания трехсторонней монеты (результаты: A, B, C), и я вычисляю статистику t=(A-C)/(A+B+C),В моей задаче у меня есть набор, который случайным образом делится на наборы X и Y, возможно, равномерно, а может и нет.Я вычисляю t для X и Y. Я хочу знать, является ли различие, которое я наблюдаю в этих двух значениях t, случайным или нет.

Теперь, если бы это было простое биномиальное распределение (т.е. япросто посчитав, кто попал в X или Y), я бы знал, что делать: я вычисляю n=|X|+|Y|, σ=sqrt(np(1-p)) (и я предполагаю, что p=.5), а затем сравниваю с нормальным распределением.Так, например, если бы я наблюдал |X|=45 и |Y|=55, я бы сказал σ=5, и поэтому я ожидаю, что это отклонение от среднего μ=50 будет случайным в 68,27% случаев.С другой стороны, я ожидаю большего отклонения от среднего в 31,73% случаев.

Существует промежуточная проблема, которая также интересует меня и которая, как мне кажется, может помочь мне понять основную проблему, где я измеряю некоторые свойства членовA и B. Скажем, 25% по A положительны и 66% по B положительны.(A и B не имеют одинакового количества элементов - процесс выбора не одинаков.) Я хотел бы знать, ожидаю ли я эту разницу случайно.

В качестве первого черновика я вычислил tкак будто это было измерение монетных бросков, но я почти уверен, что это не совсем правильно.

Есть какие-нибудь указатели на то, как правильно моделировать это?

1 Ответ

0 голосов
/ 13 декабря 2018

Первая задача
Для задачи трехсторонней монеты взгляните на многочленное распределение.Это распределение, используемое для «биномиальной» задачи с более чем 2 результатами.

Вот пример из Википедии (https://en.wikipedia.org/wiki/Multinomial_distribution):

Предположим, что при трехсторонних выборахдля большой страны кандидат A получил 20% голосов, кандидат B получил 30% голосов, а кандидат C получил 50% голосов. Если шесть избирателей выбраны случайным образом, какова вероятность того, что будет ровно одинСторонник кандидата А, два сторонника кандидата Б и три сторонника кандидата С в выборке?

Примечание. Поскольку мы предполагаем, что число избирателей велико, это разумно иДопустимо думать о вероятностях как о неизменных, если для выборки выбран избиратель. Технически говоря, это выборка без замены, поэтому правильное распределение - это многомерное гипергеометрическое распределение, но распределения сходятся по мере роста населения.

formula for multinomial example


Вторая проблема
Вторая проблема - проблема кросс-таблиц.Затем используйте «критерий хи-квадрат для ассоциации», чтобы проверить, существует ли значительная связь между вашими переменными.И используйте «стандартизированные остатки» в вашей кросс-таблице, чтобы определить, какая из ассоциаций более вероятна, а какая менее вероятна.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...