Я пытаюсь суммировать несколько столбцов на основе верхних 5 значений каждой переменной в R. Ниже приведен пример данных.
df
ID A B C D
A 325 68 8 8
B 308 85 2 7
B 342 99 6 2
A 439 83 9 6
A 278 60 10 2
A 367 78 14 4
C 136 59 12 5
C 259 73 11 4
B 338 79 5 6
B 461 99 3 7
D 364 73 14 4
D 238 80 3 8
A 266 54 10 10
Мой текущий код выглядит следующим образом:
df2 <- df %>% group_by(ID) %>% top_n(5, A) %>% summarise(ATop5 = mean(A))
Вывод в df2 отображает информацию, которая мне нужна.
Однако у меня есть несколько переменных в исходном фрейме данных, которые я буду sh запускать и отображать в том же выводе, что и df2.
В настоящее время я создаю отдельный df для каждой переменной и затем объединение в один df через столбец ID.
Пропуск этого шага будет очень полезен.