Вероятность покрытия для неопределенного CDF - PullRequest
0 голосов
/ 22 сентября 2018

Я использовал следующий код r для определения вероятности покрытия.

theta <- seq(0,1, length = 100)
CD_theta <- function(y, p, n){
  1 - pbinom (y, size = n, prob = p) + 1/2*dbinom(y, size = n, prob = p)
}

y <- 5
n <- 100
phat <- y/n
mytheta <- CD_theta(5, theta, 100)

set.seed(650)
ci <- list()
n <- 100
B <- 1000
result = rep(NA, B)
all_confInt <- function(B) {
for (i in 1:B){
  boot.sample <- sample(mytheta, replace = TRUE)
  lower <- theta[which.min(abs(boot.sample - .025))]
  upper <- theta[which.min(abs(boot.sample - .975))]
  ci[[i]] <- data.frame(lowerCI = lower, upperCI = upper)
  intervals <- unlist(ci)
}
  return(intervals)
}

df <- data.frame(matrix(all_confInt(B), nrow=B, byrow=T))
colnames(df)[1] <- "Lower"
colnames(df)[2] <- "Upper"
names(df)
dim(df)
mean(df$Lower < phat & df$Upper > phat)*100 

Однако я получил 6,4%, что слишком мало.Почему у меня действительно низкий процент?Есть ли проблема в функции r?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...