Я пытаюсь запустить симуляцию, как оценить параметры нормального распределения, когда у нас мало наблюдений. Я использую 50 наблюдений - в большинстве учебников говорится, что когда у нас есть 30 и более наблюдений, выполняется центральная предельная теорема.
Здесь я использую bootstrap для получения распределения среднего значения данных, а также стандартного отклонения данных:
A <- rnorm(50, 10, 4)
sd(A)
mean(A)
res <- tibble()
for (i in 1:500) {
message(i)
res_i <- cbind(mean =
sample_n(data.frame(A), size = length(A), replace = T) %>%
pull(A) %>% mean(),
sd = sample_n(data.frame(A), size = length(A), replace = T) %>%
pull(A) %>% sd())
res <- rbind(res, res_i)
}
res %>%
gather(key, value) %>%
ggplot(aes(value)) +
geom_histogram(aes(fill = key))
MASS::fitdistr(res$mean, "normal")
MASS::fitdistr(res$sd, "normal")
Есть ли лучший способ получить параметр распределения DGP. Здесь я в основном говорю, что нормальное распределение DGP имеет среднее значение из нормального распределения и SD из нормального распределения: N (N (mu1, sd1), N (mu2, sd2)).
-сложно?