У меня большой набор данных, и есть много разных столбцов, по которым я пытаюсь сгруппировать данные. Я пытаюсь создать новый столбец, используя dplyr и mutate, что является средним значением для каждой отдельной группы. Затем я хочу увидеть разницу между этими средствами и средним значением только одной категории.
Этот вопрос может относиться к набору данных mtcars. Как бы я сгруппировал данные mtcars по "cyl" и "gear", а затем взял бы среднее значение "mpg" для каждой группы. Затем я хочу увидеть разницу среднего значения "mpg" в каждой группе по сравнению со всеми автомобилями с "gear" == 5, но с переменной "cyl".
Я прошу прощения, если задаю тот же вопрос, что и другие, но я не смог найти этот конкретный вопрос.
df <- mtcars
df2 <- df %>% group_by(cyl, gear) %>% mutate(mean_mpg = mean(mpg))