У меня большой набор данных, похожий по структуре на этот небольшой набор данных:
ID <- c(1,2,3,1,2,3,1,2,3)
Time_point <- c("T0", "T0", "T0", "T1", "T1", "T1", "T2", "T2", "T2")
Score <- c(35, 45, 25, 45, 45, 40, 60, 50, 40)
Practice_h <- c(NA, NA, NA, 2, 0, 3, 2, 1, 1)
df <- data.frame(ID, Time_point, Score, Practice_h)
rm(ID, Time_point, Score, Practice_h)
df
ID Time_point Score Practice_h
1 1 T0 35 NA
2 2 T0 45 NA
3 3 T0 25 NA
4 1 T1 45 2
5 2 T1 45 0
6 3 T1 40 3
7 1 T2 60 2
8 2 T2 50 1
9 3 T2 40 1
Два вопроса:
1) Я хотел бы запустить в паре t-тест, сравнивающий оценки разных людей (обозначенные идентификатором) в разные моменты времени.Как я могу сделать это, не распространяя набор данных?
2) Я хотел бы сделать простую регрессию, проверяя, влияет ли практика на различия в баллах.Для этого мне нужно будет рассчитать разницу между оценкой по Т2 и Т1 для каждого идентификатора.Любая идея, как я могу сделать это, используя эту организацию данных?
(Причина, по которой я не хочу распространять свои данные, как показано ниже, заключается в том, что построение оценок, сгруппированных по временным точкам в одном графике, является проблематичным в этомформат.)
ID score_T0 score_T1 score_T2 practice_T1 practice_T2
1 1 35 45 60 2 2
2 2 45 45 50 0 1
3 3 25 40 40 3 1
Я знаю, что это много, чтобы спросить, и я очень благодарен за любую помощь, которую я могу получить, даже частичные ответы.Спасибо!