Как использовать pnorm в R для вычисления вероятности того, что среднее значение N случайных величин меньше заданного значения - PullRequest
0 голосов
/ 06 апреля 2019

В R допустим, что время жизни калькулятора определенного типа соответствует нормальному распределению со средним значением = 5000 часов и SD = 500 часов.Если бы мне пришлось случайным образом выбрать калькулятор, то какова вероятность, что он продлится менее 4000 часов?

Мой расчет в R такой, как показано ниже -

pnorm(4000, mean=5000, sd =500)

[1] 0.02275013

Правильно ли мое пониманиечто вероятность составляет 0,02275013 ?

Далее, скажем, случайная выборка из 15 калькуляторов выбрана.Какова вероятность того, что средняя продолжительность жизни составляет менее 4000 часов?Я не уверен, как это сделать в R?Что я сделал, это

sample<-rnorm(15, mean = 5000, sd =500)
pop<-sd(sample/sqrt(15))
pnorm(4000, 4800, pop)

[1] 1.723545e-10

Правильно ли мое понимание?

1 Ответ

2 голосов
/ 06 апреля 2019

ТАК для вопросов кодирования. Это не большой вопрос кодирования. Но я все равно пойду.

Начну с того, что в руководящих принципах SO говорится: «Вопросы, требующие справки по домашнему заданию должны включать в себя краткое описание работы, проделанной вами до сих пор для решения проблемы, и описание сложности у вас есть решение этого ". Я не уверен, что этот вопрос [править: вопрос в том виде, в котором он был задан изначально] соответствует этому руководству, но это важная тема статистики, поэтому давайте рассмотрим ее.

Вы правы, что pnorm возвращает совокупную вероятность до q (здесь q = 4000) для нормального распределения с заданным средним и стандартным отклонением (здесь, 5000 и 500). Так что да, вероятно, что случайно выбранный калькулятор длится менее 4000 часов, это 0,02275, то есть примерно 2,3% калькуляторов работают менее 4000 часов.

Ваш главный вопрос, однако, касается среднего из 15 случайно выбранных калькуляторов. Эта статистика (среднее) будет иметь распределение вероятностей. Оказывается, что среднее из N случайных величин распределено у каждой N (mu, sigma ^ 2) и независимо от других, имеет нормальное распределение с тем же ожиданием (mu) и дисперсией sigma ^ 2 / N. Короче говоря:

  • Если X_i ~ N (mu, sigma ^ 2) для i = 1, ..., N и они независимы
  • Тогда значит ~ N (мю, сигма ^ 2 / N)

Итак, в R:

pnorm(4000, mean=5000, sd=500/sqrt(15))
# 4.742869e-15

Это фактически ноль. Это имеет смысл, поскольку вероятность случайной выборки одного калькулятора может быть низкой, что длится менее 4000 часов (всего 2,3%). Произвольная выборка из 15 калькуляторов со средним значением менее 4000 часов была бы крайне неудачной, и, таким образом, вероятность такого события близка к нулю.

...