Составьте две раздельные модели вместе в ggplot2 - PullRequest
0 голосов
/ 17 марта 2019

Я хотел бы построить две отдельные модели вместе в ggplot2, и для этого я стараюсь поместить две geom_line () и не работает. В моем примере:

#Artificial data set
Consumption <- c(501, 502, 503, 504, 26, 27, 55, 56, 68, 69, 72, 93)
Gender <- gl(n = 2, k = 6, length = 2*6, labels = c("Male", "Female"), ordered = FALSE)
Income <- c(5010, 5020, 5030, 5040, 260, 270, 550, 560, 680, 690, 720, 930)
df3 <- data.frame(Consumption, Gender, Income)
df3

# GLM Regression 
fm1 <- glm(Consumption~Gender+Income, data=df3, family=poisson)
summary(fm1)

# ANOVA
anova(fm1,test="Chi")
       Df Deviance Resid. Df Resid. Dev  Pr(>Chi)    
NULL                      11    2467.24              
Gender  1   1200.2        10    1267.03 < 2.2e-16 ***
Income  1   1262.9         9       4.16 < 2.2e-16 ***

#Genders are different than I ajusted one model for male and another for Female

#Male model
df4<-df3[df3$Gender=="Male",]
fm2 <- glm(Consumption~Income, data=df4, family=poisson)
summary(fm2)

#Female model
df5<-df3[df3$Gender=="Female",]
fm3 <- glm(Consumption~Income, data=df5, family=poisson)
summary(fm3)

#Predict
df3 = cbind(df3, predM = predict(fm2, data=df3, type = "response"))#Estimate values for male
df3 = cbind(df3, predF = predict(fm3, data=df3, type = "response"))#Estimate values for female


#Plot
ggplot(data=df3, mapping=aes(x=Income, y=Consumption)) + 
  geom_point() +  
  geom_line(mapping=aes(y=predM,x=Income)) +
  geom_line(mapping=aes(y=predF, x=Income)) 
#

И мой неправильный выходной сюжет был:

bizarre

Кто-нибудь, без создания только одной модели, может мне помочь, пожалуйста?

1 Ответ

1 голос
/ 17 марта 2019

Я думал, что было бы более разумно использовать мужскую модель только для мужских данных, а женскую модель только для женских данных. Вот подход, который объединяет два набора прогнозов и связывает их с исходными данными. Затем я использую tidyr::gather, поэтому фактическое и прогнозируемое потребление помещаются в один столбец, что упрощает подачу в ggplot:

Predictions <- c(predict(fm2, data = df4, type = "response"),
                 predict(fm3, data = df5, type = "response"))
df3_combined <- cbind(df3, Predictions)

library(tidyverse)
df3_combined %>%
  gather(type, value, Consumption, Predictions) %>%
  ggplot(mapping=aes(x=Income, y=value, color = Gender, lty = type)) + 
  geom_point() +  geom_line()

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...