Как исследовать данные по определенному столбцу в R - PullRequest
0 голосов
/ 28 мая 2019

Мне трудно исследовать, обобщать и визуализировать фрейм данных по конкретному столбцу.Мои данные «services» имеют следующий формат (я вставлю только первые 5 строк, так как мои данные очень большие:

enter image description here

services = data.frame(ID = 1:5,
           Sex = c('F','F','M','M','M'),
           Internet_Service = c(rep('Fiber optic', 2), rep('DSL',3)),
           Phone_service = c('Yes', 'Yes','Yes','No', 'No'),
           Payment_method = c('transfer','transfer','bill','bill','bill'),
           Monthly_charges = c(23,45,54,65,65),
           Total_Charges = c(78,67,98,67,90),
           Churn = c('Yes', 'No', 'Yes', 'No', 'Yes'))

Я изучил данные с помощью «Churn» (см. Код ниже). Теперь я хотел бы изучить с помощью «Total_Charges», но это числовые данные, а не фактор, и я не уверен, как поступить.нравится создавать резюме и графики.

services %>% 
  group_by(Churn) %>% 
  summarise(Count = n())%>% 
  mutate(percent = prop.table(Count)*100)%>%
  ggplot(aes(reorder(Churn, -percent), percent), fill = Churn)+
  geom_col(fill = c("#505050", "#D3D3D3"))+
  theme_bw()+  
  scale_y_continuous(expand = c(0, 0), limits = c(0,100))   + 
  xlab("Churn") + 
  ylab("Percent")+
  ggtitle("Churn Percent")

Не могли бы вы помочь мне разобраться? Спасибо.

1 Ответ

0 голосов
/ 28 мая 2019

Как это?

    services %>% 
    group_by(Sex) %>% #you can use any of the factors to group by
    summarise(mean=mean(Total_Charges))
    services %>%
    ggplot(aes(Sex,Total_Charges))+
    geom_boxplot()+
    theme_bw()
...