Я бы сказал, да. Взяв 10 000 000 образцов, вы случайным образом отобрали большую часть экспериментального пространства. Если вы установили.seed одинаково для обоих упомянутых вами подходов, вы получите точно такой же ответ. Если вы измените начальное число и запустите t-тест, результаты существенно не будут отличаться.
#First Method
seed <- 5554
set.seed(seed)
group_of_means_1 <- replicate(n=10000, expr = mean(rnorm(1000)))
set.seed(seed)
mean_of_means_1 <- mean(replicate(n=10000, expr = mean(rnorm(1000))))
#Method you propose
set.seed(5554)
big_sample <- data.frame(
group=rep(1:10000, each=1000),
samples=rnorm(10000 * 1000, 0, 1)
)
group_means_2 <- aggregate(samples ~ group,
FUN = mean,
data=big_sample)
mean_of_means_2 <- mean(group_means_2$samples)
#comparison
mean_of_means_1 == mean_of_means_2
t.test(group_of_means_1, group_means_2$samples)