Мои данные содержат статистические данные о результатах футбольного матча с 12806 наблюдениями (результатами матчей) и 34 ключевыми показателями эффективности.
(маленький) пример моего data.frame приведен ниже:
head(Test)
MatchID Outcome Var1 Var2 Var3 Var4 Var5
1 30 Loss 0 10 0 10 0
2 30 Win 6 13 6 13 6
3 31 Loss 8 12 3 6 3
4 31 Win 29 40 9 19 3
5 32 Loss 7 26 7 26 6
6 32 Win 11 20 11 20 9
Для каждого уникального "идентификатора матча" я хочу вычесть каждый из проигравших (Outcome == "Loss" ключевых показателей эффективности из команды-победителя (Outcome == "Win"). Мой data.set не являетсявсегда упорядоченный по Loss, Win, Loss, Win, так что завершение этого подряд может быть невозможным.
Я пробовал следующее, используя dplyr:
Differences <- Test %>%
group_by(MatchID) %>%
summarise_at( .vars = names(.)[3:7], ((Outcome == "Win") - (Outcome == "Loss")))
, но я боюсьЯ использую неправильный подход, так как я получил следующую ошибку: Error in inherits(x, "fun_list") : object 'Outcome' not found
Мой ожидаемый результат будет:
head(AnticipatedOutcome)
MatchID Var1 Var2 Var3 Var4 Var5
1 30 6 3 6 3 6
3 31 21 28 6 13 0
5 32 4 -6 4 -6 3
Этого можно достичь, используя dplyr?