Я пытаюсь нанести данные о женщине и мужчине за каждый год на график фасетной упаковки. Например, за 2013 год было 10 949 точек данных для женщин и 53 351 точек данных для мужчин. Вот образец данных:
cost gender year
1 305.665 Female 2013
2 194.380 Female 2013
3 462.490 Female 2013
4 200.430 Female 2013
5 188.570 Female 2013
6 277.245 Female 2013
Код, который я собрал:
library(ggplot2)
costs<-read.table("cost_data.txt",header=TRUE)
df<-data.frame(costs)
ggplot(df, aes(df$cost,color=df$gender)) +
geom_histogram(breaks=seq(0,3000,by=20),alpha=0.2) + facet_wrap(~year)+
labs(x="Costs",y="Number of Members")
Который дает следующий график:
Теперь, если я только что построил гистограмму 2013 года в Excel с шириной бина 20, женский график достиг бы максимума при 300 счетах, а мужской - при 1800 счетах. Так что то, что я нарисовал на графике, не имеет смысла для меня. Он показывает женщину выше, чем мужчина, и я не уверен, почему легенда (или гистограммы) не являются сплошными.
Просто нужно небольшое руководство.