Я работал с набором данных, который состоит из двух разных групп наблюдений, где значение является целым числом.Я хотел изобразить их плотность, чтобы понять, как различные группы распределены по значениям.
То, что случилось, было то, что одна группа имела "гладкую" плотность, в то время как другая имела "волнистую" плотность.Я знаю, что это как-то связано с пропускной способностью, а также с тем фактом, что мои данные в основном связаны с дискретными наблюдениями, но я бы хотел, чтобы кто-нибудь точно объяснил, почему.
Вот пример:
data2 <- rbind(
data.frame(group=rep('poisson1', 1000), value = rpois(1000, 5)),
data.frame(group=rep('poisson2', 1000), value = rpois(1000, 45)))
library(ggplot2)
ggplot(data2, aes(x=value, fill=group)) +
geom_density()
И, как ни странно, я снова могу создать этот фрейм данных, чтобы получить новый образец, и график иногда бывает плавным: