Рассмотрим следующую ситуацию, когда у вас есть 800 против 200 наблюдений:
library(ggplot2)
df <- data.frame(
x = rnorm(1000, rep(c(1, 2), c(800, 200))),
class = rep(c("A", "B"), c(800, 200))
)
ggplot(df, aes(x, fill = class)) +
geom_histogram(bins = 20, position = "identity", alpha = 0.5,
# Note that y = stat(count) is the default behaviour
mapping = aes(y = stat(count)))
data:image/s3,"s3://crabby-images/ac520/ac520e0c1c56f0fb4f9f7cf0102ec1b4d7a282b8" alt="enter image description here"
Вы можете масштабировать счет для каждой группы до максимума 1 с помощью y = stat(ncount)
:
ggplot(df, aes(x, fill = class)) +
geom_histogram(bins = 20, position = "identity", alpha = 0.5,
mapping = aes(y = stat(ncount)))
data:image/s3,"s3://crabby-images/32a9c/32a9cc08c6d42369291b465e3cb1e250b45272fd" alt="enter image description here"
В качестве альтернативы, вы можете установить y = stat(density)
, чтобы общая площадь интегрировалась в 1.
ggplot(df, aes(x, fill = class)) +
geom_histogram(bins = 20, position = "identity", alpha = 0.5,
mapping = aes(y = stat(density)))
data:image/s3,"s3://crabby-images/25af4/25af48ac203e4134cb71efbf87996d40ac7e1c72" alt="enter image description here"
Обратите внимание, что после ggplot 3.3.0 stat()
вероятно будет заменено на after_stat()
.