вероятность и относительная частота - PullRequest
1 голос
/ 08 мая 2009

Если я использую относительную частоту для оценки вероятности события, насколько хороша моя оценка, основанная на количестве экспериментов? Является ли стандартное отклонение хорошей мерой? Бумага / ссылка / онлайн книга была бы идеальной.

http://en.wikipedia.org/wiki/Frequentist

Ответы [ 3 ]

4 голосов
/ 08 мая 2009

Я полагаю, вы ищете доверительный интервал для выборочной доли. Вот некоторые ресурсы, которые могут быть полезны:

Доверительный интервал для учебного пособия по пропорциям
Доверительный интервал для раздаточного материала

В основном ваша оценка улучшается обратно пропорционально квадратному корню из числа выборок. Поэтому, если вы хотите сократить свою ошибку пополам, вам понадобится в четыре раза больше образцов.

0 голосов
/ 08 мая 2009

Вы считаете количество успехов s в последовательности n экспериментов Да / Нет, верно? Пока отдельные эксперименты независимы, вы находитесь в сфере биномиального распределения ( Wikipedia ). Частота успеха f = s / n является оценкой вероятности успеха p и. Дисперсия вашей оценки частоты f равна p * (1-p) / n для n тиражей.

Пока p не слишком близко к нулю или 1, и пока у вас нет "слишком маленького" числа наблюдений n, стандартное отклонение будет разумной мерой для качества вашей оценки f.

Если n достаточно велико (практическое правило n * p> 10), вы можете аппроксимировать его нормальным распределением N (f, f * (1-f) / n), и оценка стандартного отклонения является хорошей мерой. См. здесь для более подробного обсуждения.

Это говорит о том, что приближение со стандартным отклонением не будет сокращать лед, если для этого потребуется некоторая академическая строгость (например, домашнее задание).

0 голосов
/ 08 мая 2009

Вероятно, вам нужен тест хи-квадрат. См., Например, страницу википедии по критерию хи-квадрат Пирсона . Стандартное отклонение - это не то, что вам нужно, поскольку оно касается формы распределения, а не того, насколько точно вы оцениваете фактическое распределение. Кроме того, обратите внимание, что большинство этих вещей относится к «нормальным» дистрибутивам, и не все дистрибутивы являются нормальными.

...