Получить частоту, используя цикл в dplyr - PullRequest
1 голос
/ 07 апреля 2019

Я пытаюсь получить индивидуальную таблицу частот для каждой переменной, используя цикл и пакет dplyr, пример моего кода ниже с использованием данных mtcars:

library(dplyr)

var= c("vs", "am", "gear")

for (i in var){
mtcars %>%
group_by(carb) %>%
count(i)
}

Печально только я получаю:

Error: Column `i` is unknown

Я тоже пробовал с

for (i in var){
mtcars %>%
group_by(carb) %>%
summarise_each(funs(n()), i)
}

Но не так, Пожалуйста, любой совет, я буду благодарен.

Ответы [ 2 ]

0 голосов
/ 07 апреля 2019

Мы можем использовать !!sym() для имен переменных.Я также рекомендовал бы сохранять результаты в списке следующим образом.

var <- c("vs", "am", "gear")

library(dplyr)

count_tables <- list()

for (i in var){
  temp <- mtcars %>%
    group_by(carb) %>%
    count(!!sym(i))

  count_tables[[i]] <- temp       
}

count_tables
# $vs
# # A tibble: 8 x 3
# # Groups:   carb [6]
#    carb    vs     n
#   <dbl> <dbl> <int>
# 1     1     1     7
# 2     2     0     5
# 3     2     1     5
# 4     3     0     3
# 5     4     0     8
# 6     4     1     2
# 7     6     0     1
# 8     8     0     1
# 
# $am
# # A tibble: 9 x 3
# # Groups:   carb [6]
#   carb    am     n
#   <dbl> <dbl> <int>
# 1     1     0     3
# 2     1     1     4
# 3     2     0     6
# 4     2     1     4
# 5     3     0     3
# 6     4     0     7
# 7     4     1     3
# 8     6     1     1
# 9     8     1     1
# 
# $gear
# # A tibble: 11 x 3
# # Groups:   carb [6]
#     carb  gear     n
#    <dbl> <dbl> <int>
#  1     1     3     3
#  2     1     4     4
#  3     2     3     4
#  4     2     4     4
#  5     2     5     2
#  6     3     3     3
#  7     4     3     5
#  8     4     4     4
#  9     4     5     1
# 10     6     5     1
# 11     8     5     1

Также обычно используется lapply для циклического перемещения по вектору или списку для применения функции и возврата объектов в видесписок.Следующий код генерирует тот же вывод, что и цикл for.

count_tables <- lapply(var, function(x) {
  mtcars %>%
    group_by(carb) %>%
    count(!!sym(i))
})
names(count_tables) <- var
0 голосов
/ 07 апреля 2019

Для программной передачи переменной в виде строки вы можете использовать версию этих функций с подчеркиванием в конце, например count_, group_by_ и т. Д.

В этом случае это будетbe:

for (i in var){
  mtcars %>%
    group_by(carb) %>%
    count_(i) %>% 
    print()
}

Вы специально запросили цикл for, но для вашего рассмотрения предлагается альтернатива lapply, которая упрощает хранение различных результатов в одном месте для последующего доступа:

lapply(var, FUN = function(i) mtcars %>% group_by(carb) %>% count_(i))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...