R: Как статистически анализировать парные данные в наборе данных, который имеет собранный формат? - PullRequest
1 голос
/ 21 марта 2019

У меня большой набор данных, похожий по структуре на этот небольшой набор данных:

ID <- c(1,2,3,1,2,3,1,2,3)
Time_point <- c("T0", "T0", "T0", "T1", "T1", "T1", "T2", "T2", "T2")
Score <- c(35, 45, 25, 45, 45, 40, 60, 50, 40)
Practice_h <- c(NA, NA, NA, 2, 0, 3, 2, 1, 1)
df <- data.frame(ID, Time_point, Score, Practice_h)
rm(ID, Time_point, Score, Practice_h)

df

  ID Time_point Score Practice_h
1  1        T0    35         NA
2  2        T0    45         NA
3  3        T0    25         NA
4  1        T1    45          2
5  2        T1    45          0
6  3        T1    40          3
7  1        T2    60          2
8  2        T2    50          1
9  3        T2    40          1

Два вопроса:

1) Я хотел бы запустить в паре t-тест, сравнивающий оценки разных людей (обозначенные идентификатором) в разные моменты времени.Как я могу сделать это, не распространяя набор данных?

2) Я хотел бы сделать простую регрессию, проверяя, влияет ли практика на различия в баллах.Для этого мне нужно будет рассчитать разницу между оценкой по Т2 и Т1 для каждого идентификатора.Любая идея, как я могу сделать это, используя эту организацию данных?

(Причина, по которой я не хочу распространять свои данные, как показано ниже, заключается в том, что построение оценок, сгруппированных по временным точкам в одном графике, является проблематичным в этомформат.)

  ID score_T0 score_T1 score_T2 practice_T1 practice_T2
1  1       35       45       60           2           2
2  2       45       45       50           0           1
3  3       25       40       40           3           1

Я знаю, что это много, чтобы спросить, и я очень благодарен за любую помощь, которую я могу получить, даже частичные ответы.Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...