так вот воспроизводимый пример
a <- data.frame(rnorm(1000,0,1))
colnames(a) <- c("test")
ggplot(a,aes(test)) +
geom_histogram(aes(y=(..count..)/sum(..count..))) +
scale_y_continuous(labels=scales::percent) +
stat_function(fun='dnorm')
Это показывает мой график при 40% на 0. Когда я ухожу от 0 и 1, распределение становится фактически ближе к реальному. Значения, которые я использую в действительности, на самом деле близки к rnorm(1000,0,1)
, поэтому это очень близкий пример