Оценка параметров нормального распределения с использованием bootstrap [r] - PullRequest
0 голосов
/ 01 августа 2020

Я пытаюсь запустить симуляцию, как оценить параметры нормального распределения, когда у нас мало наблюдений. Я использую 50 наблюдений - в большинстве учебников говорится, что когда у нас есть 30 и более наблюдений, выполняется центральная предельная теорема.

Здесь я использую bootstrap для получения распределения среднего значения данных, а также стандартного отклонения данных:

A <- rnorm(50, 10, 4)

sd(A)
mean(A)

res <- tibble()
for (i in 1:500) {
  message(i)
  res_i <- cbind(mean = 
          sample_n(data.frame(A), size = length(A), replace = T) %>% 
          pull(A) %>% mean(), 
        sd = sample_n(data.frame(A), size = length(A), replace = T) %>% 
          pull(A) %>% sd())
  res <- rbind(res, res_i)  
}

res %>% 
  gather(key, value) %>% 
  ggplot(aes(value)) + 
    geom_histogram(aes(fill = key))


MASS::fitdistr(res$mean, "normal")
MASS::fitdistr(res$sd, "normal")

Есть ли лучший способ получить параметр распределения DGP. Здесь я в основном говорю, что нормальное распределение DGP имеет среднее значение из нормального распределения и SD из нормального распределения: N (N (mu1, sd1), N (mu2, sd2)).

-сложно?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...