Допустим, я бы хотел вычислить mean
, min
и max
для произвольного количества групп в пользовательской функции.
Данные игрушек выглядят так:
library(tidyverse)
df <- tibble(
Gender = c("m", "f", "f", "m", "m",
"f", "f", "f", "m", "f"),
IQ = rnorm(10, 100, 15),
Other = runif(10),
Test = rnorm(10),
group2 = c("A", "A", "A", "A", "A",
"B", "B", "B", "B", "B")
)
Чтобы достичь этого для двух групп (пол, группа2), я мог бы использовать
df %>%
gather(Variable, Value, -c(Gender, group2)) %>%
group_by(Gender, group2, Variable) %>%
summarise(mean = mean(Value),
min = min(Value),
max = max(Value))
, который можно интегрировать сновые curly-curly
операторы из rlang
с
descriptive_by <- function(data, group1, group2) {
data %>%
gather(Variable, Value, -c({{ group1 }}, {{ group2 }})) %>%
group_by({{ group1 }}, {{ group2 }}, Variable) %>%
summarise(mean = mean(Value),
min = min(Value),
max = max(Value))
}
Обычно я предполагаю, что могу заменить указанные группы на ...
, но, похоже, это не так
descriptive_by <- function(data, ...) {
data %>%
gather(Variable, Value, -c(...)) %>%
group_by(..., Variable) %>%
summarise(mean = mean(Value),
min = min(Value),
max = max(Value))
}
, поскольку возвращает ошибку
Ошибка в map_lgl (.x, .p, ...): объект 'Gender' не найден