Подсчет количества наблюдений по столбцу и по группам - PullRequest
0 голосов
/ 23 сентября 2019

У меня есть следующие данные - вот снимок, есть еще много столбцов оценок и весов.

    flows <- structure(list(Student = c("Adam", "Char", "Fred", "Greg", "Ed", "Mick", "Dave", "Nick", "Tim", "George", "Tom"), 
                            Class = c(1L, 1L, 1L, 1L, 2L, 2L, 3L, 3L, 3L, 3L, 3L), score_Jan_2018 = c(NA, 5L, -7L, 2L, 1L, NA, 5L, 8L, -2L, 5L, NA), 
                            score_Feb_2018 = c(2L,   0, 8L, NA, 2L, 6L, NA, 8L, 7L, 3L, 8L), Weight_Jan_2018 = c(150L, 30L, NA, 80L, 60L, 80L, 40L, 12L, 23L, 65L, 78L), 
                            Weight_Feb_2018 = c(153L, 60L, 80L, 40L, 80L, 30L, 25L, 45L, 40L, NA, 50L)), class = "data.frame", row.names = c(NA, -11L))

Я хотел бы подсчитать для каждого столбца оценок количество наблюдений по классам.Например,

  Class   score_Jan_2018  score_Feb_2018
    1          3              3
    2          1              2
    3          4              4

Я попробовал следующее, но он вывел только серию NA для большинства значений.

flows_by_class = flows %>%  
  group_by(Class) %>%
  summarise_at(vars(starts_with("score_")), ~sum(.!= 0))

Любая помощь приветствуется.

1 Ответ

0 голосов
/ 23 сентября 2019

Использование by() в базе R.

cbind(Class=unique(flows$Class), sapply(names(flows)[3:4], function(x)
  by(flows[x], flows$Class, function(x) length(na.omit(x[x != 0])))))
#   Class score_Jan_2018 score_Feb_2018
# 1     1              3              2
# 2     2              1              2
# 3     3              4              4
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...