Я ищу способ вычисления двух переменных grouped_by:
Age <- sample(c("4", "5", "6", "adult"), 20, replace = TRUE)
letter <- sample(c("a", "c", "d"), 20, replace = TRUE)
measurement <- sample(1.5:50.5, 20, replace = TRUE)
df <- data_frame(Age, letter, measurement)
Я хочу указать group_by Возраст и букву
df2 <- df %>%
group_by(Age, letter)
, но затем я хочу вычислить разница между медианным измерением из одного подмножества возраста и другого:
df2 <- df %>%
group_by(Age, letter) %>%
mutate(diff = median(measurement[Age=='adult']) - median(measurement[Age!='adult']))
Я хочу разницу между «измерением» (от взрослых) и «измерением» (из каждой возрастной группы) для каждой возрастной группы и комбинация букв Я в настоящее время генерирую NA; мой подход не верен. Должен быть лучший способ.