Я потратил 2 месяца на размышления, достоин ли этот вопрос StackOverflow, и я пришел к выводу, что это так.
Я добровольно работаю в команде в течение года, чтобы предсказать ряд интересных вещей, несколько месяцев назад она предсказывала вероятность количества землетрясений во всем мире в течение 5 месяцев в марте. Действительно интересная проблема. Думал, что я неплохо справился с R, а затем столкнулся с этой проблемой, как кирпичная стена. Это проблема подсчета, я хотел бы использовать распределение Пуассона, но это не сработает, среднее и дисперсия не равны. Он рассредоточен.
Цель состоит в том, чтобы оценить вероятность:
<100 землетрясений
100-140 землетрясений 140-170 землетрясений 170-210 <br>
землетрясения 210 землетрясений
Но я написал здесь немного кода:
#(load data and libaries blah blah blah)
quakes_this_month<-10
days_left=31-1
days_left
month_left<- days_left/31
month_left
earthq5<- earthq4
earthq5$mag<-earthq5$mag*month_left
mu <- mean(earthq5$mag)
sigma <- sd(earthq5$mag)
paste("mean is ",mu, " and sigma is ", sigma)
pnorm((99-quakes_this_month) , mu, sigma, lower.tail = T)
lower.bound<- 100 -quakes_this_month
upper.bound<- 140.5-quakes_this_month
(pnorm(upper.bound, mu, sigma, lower.tail = T) - pnorm(lower.bound, mu, sigma))
lower.bound<- 140.5-quakes_this_month
upper.bound<- 170.5-quakes_this_month
(pnorm(upper.bound, mu, sigma) - pnorm(lower.bound, mu, sigma))
lower.bound<- 170.5-quakes_this_month
upper.bound<- 210.5-quakes_this_month
(pnorm(upper.bound, mu, sigma) - pnorm(lower.bound, mu, sigma))
(pnorm(210.5-quakes_this_month, mu, sigma, lower.tail = F))
Так что идея здесь в том, что месяц прогрессирует, и произошло несколько землетрясений, и я могу оценить вероятность достижения этих предельных порогов. Однако это не гауссовский дистрибутив, я не могу использовать pnorm, я должен использовать pnbinom(q, size, prob, mu, lower.tail = TRUE, log.p = FALSE)
, но я не знаю, как вывести «size» и «prob» из проблемы с подсчетом. Это не берет 15 шаров из банки 4 раза. Так что я обращаюсь к этому, так как он преследовал меня в течение нескольких недель.
Как я могу использовать pnbinom()
вместо pnorm()
, если речь идет о количестве землетрясений в месяц?