Как найти доверительный интервал для общего количества событий - PullRequest
1 голос
/ 05 августа 2010

У меня есть программа, которая записывает события, которые происходят с некоторой вероятностью p .После запуска я получаю k записанных событий.Как я могу подсчитать, сколько событий было записано или нет, с некоторой достоверностью, скажем, 95%?

Так, например, после получения 13 зарегистрированных событий я хотел бы иметь возможность рассчитать, что былои всего 19 событий с вероятностью 95%.

Ответы [ 4 ]

0 голосов
/ 06 августа 2010

Вот ответ , который Эндрю Уокер дал на сайте статистики. Я собираюсь принять это как ответ на этот вопрос. Спасибо всем.

0 голосов
/ 06 августа 2010

Если p находится между 0 и 1:

(1 / p) * k = типичное количество фактических событий

Если ваш random () ИДЕАЛЬНЫЙ, он ВСЕГДА будет верным. Однако обычно это не так.

Для БОЛЬШОГО k (чем больше, тем точнее базовый результат в процентах от отклонения), оно будет ЗАКРЫТО с фактическим числом, хотя сомнительно, что оно точно его достигнет.

0 голосов
/ 06 августа 2010

Проблема с вашим утверждением состоит в том, что вы говорите, что есть известная вероятность события.Если это известно, и вы знаете, сколько событий вы видели, нет ошибки в том, сколько событий было.Вы знаете, сколько было записей?

Я думаю, вам нужно пересмотреть способ, которым вы задаете вопрос, или попытаться оценить что-то другое.

Или вы говорите, что ваша запись происходит только в 60% случаев, когда происходит настоящее событие.Что вы измеряете и что представляет собой событие?Можно было бы провести аналогию, но в том виде, в каком она сформулирована сейчас, нет способа построить доверительный интервал для истинного числа событий.

0 голосов
/ 05 августа 2010

Я почти уверен, что ваш процесс такой же, как биномиальный процесс - вероятность p записываемого события можно считать успешной. Я не думаю, что есть необходимость более подробно останавливаться на базовом процессе.

Суть вашей проблемы в том, что вы не знаете значения n, только k и p. Расчеты доверительного интервала обычно предполагают, что вы знаете n & p и хотите, чтобы доверительный интервал составлял k, то есть количество успехов. См. здесь.

Учитывая k и p, вы должны быть в состоянии определить вероятностное распределение n, q (n), а затем создать распределение k с учетом известных p и q (n). Это распределение k даст доверительный интервал, верно?

...