вопрос о реализации R для вычисления доверительного интервала - PullRequest
0 голосов
/ 24 февраля 2012

Я однажды прочитал следующую функцию R для вычисления доверительного интервала

#  set number of simulated data sets and sample size
#  mu is the mean for the normal 
   S <- 1000 
   n <- 15
   mu <- 1

покрытие обычного доверительного интервала на основе среднего значения выборки рассчитывается следующим образом. Здесь sampmean.ses обозначает стандартную ошибку для выборочного среднего. Я могу главным образом догадаться о логике этого. Что меня смущает, так это то, как R реализует это, в частности, что намеревается сделать outsampmean-t05*sampmean.ses <= mu? Похоже, сумма состоит в подсчете всех дискретных точек, удовлетворяющих этим двум условиям.

  t05 <- qt(0.975,n-1)
  coverage <- sum((outsampmean-t05*sampmean.ses <= mu) & 
      (outsampmean+t05*sampmean.ses >= mu))/S

1 Ответ

2 голосов
/ 24 февраля 2012
S       <- 1000 
n       <- 15   
mu      <- 1    
sigma   <- 50    
set.seed(1)
matdat       <- matrix(rnorm(S*n, mean = mu, sd = sigma), nrow=S)
outsampmean  <- rowSums(matdat)/n
sampmean.ses <- sqrt(rowSums((matdat-outsampmean)^2)/(n*(n-1)))
t05          <- qt(0.975,n-1)
coverage     <- sum((outsampmean-t05*sampmean.ses <= mu) & 
                    (outsampmean+t05*sampmean.ses >= mu))/S

будет производить

> coverage
[1] 0.946

outsampmean-t05*sampmean.ses <= mu выдает ИСТИНА или ЛОЖЬ (фактически 1 или 0 в сумме) в зависимости от того, находится ли нижняя граница доверительного интервала, рассчитанного по среднему значению итоговой выборки и среднему значению выборки, ниже или выше среднего по населению.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...