Ошибка «Невозможно создать вызов для не вызываемого объекта» при суммировании данных путем группировки - PullRequest
0 голосов
/ 10 декабря 2018

У меня есть следующий фрейм данных:

df <- data.frame(NR_HH = c('HH1','HH1','HH1','HH1','HH2','HH2'), ID = c(11,12,13,14,21,22), Age = c(28,25,16,4,45,70), Fem_Adult = c('FALSE','TRUE','FALSE','FALSE', 'TRUE','TRUE'),Male_Adult = c('TRUE','FALSE','FALSE','FALSE', 'FALSE','FALSE'), School_Child = c('FALSE','FALSE','TRUE','FALSE', 'FALSE','FALSE'), Preschool_Child = c('FALSE','FALSE','FALSE','TRUE', 'FALSE','FALSE'))

#  NR_HH ID Age Fem_Adult Male_Adult School_Child Preschool_Child
#1   HH1 11  28     FALSE       TRUE        FALSE           FALSE
#2   HH1 12  25      TRUE      FALSE        FALSE           FALSE
#3   HH1 13  16     FALSE      FALSE         TRUE           FALSE
#4   HH1 14   4     FALSE      FALSE        FALSE            TRUE
#5   HH2 21  45      TRUE      FALSE        FALSE           FALSE
#6   HH2 22  70      TRUE      FALSE        FALSE           FALSE

Я хочу сгруппировать эти данные по NR_HH и построить новый фрейм данных, который показывает количество взрослых женщин, взрослых мужчин, детей школьного возраста и дошкольного возраста.дети в каждом доме.Я хочу получить что-то вроде этого:

#  NR_HH Fem_Adult Male_Adult School_Child Preschool_Child
#1   HH1         1          1            1               1
#2   HH2         2          0            0               0

Я попробовал следующий код:

df_summary =df%>%group_by(NR_HH)%>%summarise_if(is.logical, sum)

Но я получаю эту ошибку:

Error: Can't create call to non-callable object

1 Ответ

0 голосов
/ 10 декабря 2018

Проблема связана с типами столбцов.Это factor столбцы, создаваемые путем кавычки 'TRUE'/'FALSE', что приводит к типу character.Но для вызова data.frame по умолчанию используется stringsAsFactors = TRUE.Таким образом, мы получаем factor класс для этих столбцов.Этого можно было бы избежать, просто сняв кавычки TRUE/FALSEПредполагая, что входные данные уже заключены в кавычки, затем преобразуйте их в logical с помощью as.logical и затем получите sum после группировки по 'NR_HH'

df %>%
   mutate_at(4:7, as.logical) %>% 
   group_by(NR_HH) %>% 
   summarise_if(is.logical, sum)
# A tibble: 2 x 5
#  NR_HH Fem_Adult Male_Adult School_Child Preschool_Child
#   <fct>     <int>      <int>        <int>           <int> 
# 1 HH1           1          1            1               1
# 2 HH2           2          0            0               0
...