Я пытаюсь вычислить, пытаясь вычислить разницу в средних значениях между двумя группами по нескольким числовым c переменным. Например, если бы у меня были следующие данные:
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 versicolor
3 4.7 3.2 1.3 0.2 versicolor
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
Я хотел бы, например, вычесть средние значения 'versicolor' из средних значений 'setosa' и сохранить их как новый dataframe.
Результат выглядит примерно так:
Sepal.Length Sepal.Width Petal.Length Petal.Width
1 0.1 0.3 0.18 0.0
Мне бы очень хотелось сделать это с помощью dplyr, который я сейчас изучаю. Кроме того, в идеале решение может быть применено к гораздо большему массиву данных (100 переменных) и может специально выбирать числовые c переменные для применения функции.
Если бы вы могли разбивать код несколько строк за строкой, это было бы действительно превосходно.
Большое спасибо.