Как я могу представить данные о мужчинах и женщинах отдельно? - PullRequest
0 голосов
/ 25 апреля 2019

Я пытаюсь нанести данные о женщине и мужчине за каждый год на график фасетной упаковки. Например, за 2013 год было 10 949 точек данных для женщин и 53 351 точек данных для мужчин. Вот образец данных:

 cost gender year
1 305.665 Female 2013
2 194.380 Female 2013
3 462.490 Female 2013
4 200.430 Female 2013
5 188.570 Female 2013
6 277.245 Female 2013

Код, который я собрал:

library(ggplot2)
costs<-read.table("cost_data.txt",header=TRUE)
df<-data.frame(costs)
ggplot(df, aes(df$cost,color=df$gender)) + 
geom_histogram(breaks=seq(0,3000,by=20),alpha=0.2) + facet_wrap(~year)+
labs(x="Costs",y="Number of Members")

Который дает следующий график:

enter image description here

Теперь, если я только что построил гистограмму 2013 года в Excel с шириной бина 20, женский график достиг бы максимума при 300 счетах, а мужской - при 1800 счетах. Так что то, что я нарисовал на графике, не имеет смысла для меня. Он показывает женщину выше, чем мужчина, и я не уверен, почему легенда (или гистограммы) не являются сплошными.

Просто нужно небольшое руководство.

1 Ответ

1 голос
/ 25 апреля 2019

Для тех, кто не читает комментарии ...

# To show bars side-by-side
geom_histogram(breaks=seq(0,3000,by=20),alpha=0.2, position = "dodge")

# To have filled bars and legend keys
ggplot(df, aes(cost,fill=gender))

# In completion
library(ggplot2)
costs<-read.table("cost_data.txt",header=TRUE)
df<-data.frame(costs)
ggplot(df, aes(cost,fill=gender)) + 
geom_histogram(breaks=seq(0,3000,by=20),alpha=0.2, position="dodge") + facet_wrap(~year)+
labs(x="Costs",y="Number of Members")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...