plyr суммирует длину строки ошибок счета - PullRequest
0 голосов
/ 16 мая 2018

предположим, у меня есть следующие данные:

A <- c(4,4,4,4,4)
B <- c(1,2,3,4,4)
C <- c(1,2,4,4,4)
D <- c(3,2,4,1,4)

filt <- c(1,1,10,8,10)


data <- as.data.frame(rbind(A,B,C,D,filt))
data <- t(data)
data <- as.data.frame(data)

> data
    A B C d filt
 V1 4 1 1 3    1
 V2 4 2 2 2    1
 V3 4 3 4 4   10
 V4 4 4 4 1    8
 V5 4 4 4 4   10

Я хочу получить подсчеты по вхождениям 1,2,3 и 4 для каждой переменной после фильтрации.В моей попытке добиться этого ниже, я получаю сообщение об ошибке: длина (строки) == 1 не является истинным.

  data %>%
     dplyr::filter(filt ==1) %>%
      plyr::summarize(A_count = count(A),
                      B_count = count(B))

Я получаю сообщение об ошибке, потому что некоторые из моих столбцов содержат не все значения 1-4.Есть ли способ указать, что он должен искать и дать 0 значений, если не найден?Я не уверен, как это сделать, если это возможно, или если есть другая работа.

Любая помощь очень признательна !!!

1 Ответ

0 голосов
/ 16 мая 2018

Это было немного странно, я не использовал классический plyr, но я думаю, что это примерно то, что вы ищете. Я удалил столбец фильтрации, filt, чтобы не получить счетчик этого:

library(dplyr)

data %>% 
  filter(filt == 1) %>% 
  select(-filt) %>%
  purrr::map_df(function(a_column){
    purrr::map_int(1:4, function(num) sum(a_column == num))
    })

# A tibble: 4 x 4
      A     B     C     D
  <int> <int> <int> <int>
1     0     1     1     0
2     0     1     1     1
3     0     0     0     1
4     2     0     0     0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...