Я пытаюсь собрать среднее значение из средних баллов для студентов. Вот как выглядит мой набор данных:
id <- c(1,1,1, 2,2,2, 3,3, 4,4,4)
mean <- c(5,5,5, 6,6,6, 7,7, 8,8,8)
data <- data.frame(id,mean)
> data
id mean
1 1 5
2 1 5
3 1 5
4 2 6
5 2 6
6 2 6
7 3 7
8 3 7
9 4 8
10 4 8
11 4 8
Я использую пакет dplyr
для этого расчета. Я использую это,
data %>%
mutate(grand.mean = mean(mean))
id mean grand.mean
1 1 5 6.454545
2 1 5 6.454545
3 1 5 6.454545
4 2 6 6.454545
5 2 6 6.454545
6 2 6 6.454545
7 3 7 6.454545
8 3 7 6.454545
9 4 8 6.454545
10 4 8 6.454545
11 4 8 6.454545
Однако, это не учитывает повторные средства для каждого идентификатора. При подсчете следует брать уникальные средства с каждого идентификатора и усреднять их. так что (5+6+7+8)/4 = 6.5
вместо 6.45
.
Есть идеи? Спасибо!