У меня есть набор данных, которым я первоначально манипулирую с помощью функции collect (). Я сейчас пытаюсь создать средние группы в собранных данных. У меня проблемы с пониманием того, как лучше составить средние данные, представленные здесь. Я надеюсь создать среднее число, связанное с каждой группой. Здесь я усредняю оценки для «наблюдателей».
РЕДАКТИРОВАТЬ: Мне нужно среднее для каждого наблюдателя за все даты наблюдения.
РЕДАКТИРОВАТЬ-2: Каждый наблюдатель имеет любое количество людей, которых они будут оценивать. Если я использую group_by (наблюдатель), среднее будет по всем наблюдениям, а не по наблюдателю.
РЕДАКТИРОВАТЬ-3: Я надеюсь увидеть средние значения каждой даты наблюдения «показатель верности». Если у меня есть 3 балла (90 100 120), я хотел бы видеть среднее значение этих значений, приписанное наблюдателю, но все же иметь возможность отображать баллы с течением времени. Результат, на который я надеюсь, будет:
![enter image description here](https://i.stack.imgur.com/M5dC6.png)
Важное примечание: все мои оценки верности из 129 возможных баллов
РЕДАКТИРОВАТЬ-4: Я хотел бы усреднить оценки наблюдателей по количеству наблюдений (date_of_observation)
Вот функция, которую я использую для создания своих средних.
LPLC_Group %>%
group_by(observer,date_of_observation)%>%
summarize(fidelity_score = sum(value,na.rm=TRUE),
average_fidelity = round(mean(fidelity_score,na.rm=TRUE),2))
Следующая dput связана с выходом функции выше. Я не могу опубликовать свой полный набор данных. Вывод этой функции должен быть достаточным для работы.
dput output:
structure(list(observer = c("Cristianne", "Cristianne", "Cristianne",
"Deb", "Deb", "Deb", "Lori", "Lori", "Lori", "Pauline", "Pauline",
"Pauline"), date_of_observation = c("6/24/19", "7/24/19", "8/24/19",
"6/24/19", "7/24/19", "8/24/19", "6/24/19", "7/24/19", "8/24/19",
"6/24/19", "7/24/19", "8/24/19"), fidelity_score = c(100L, 87L,
95L, 89L, 106L, 98L, 85L, 104L, 102L, 94L, 85L, 113L), average_fidelity = c(100,
87, 95, 89, 106, 98, 85, 104, 102, 94, 85, 113)), row.names = c(NA,
-12L), class = c("grouped_df", "tbl_df", "tbl", "data.frame"), groups = structure(list(
observer = c("Cristianne", "Deb", "Lori", "Pauline"), .rows = list(
1:3, 4:6, 7:9, 10:12)), row.names = c(NA, -4L), class = c("tbl_df",
"tbl", "data.frame"), .drop = TRUE))