От длинного до широкого с двумя повторными измерениями - PullRequest
11 голосов
/ 19 ноября 2011

Я знаю, что это неоднократно задавалось здесь под рубрикой "длинный к широкому", но я столкнулся с ситуацией, когда у меня есть две переменные значения, которые являются повторяющимися мерами.

          id sex  time      score1    score2
1  subject 1   m Time1 -0.20926263 0.2499310
2  subject 2   m Time1  0.17147511 3.2708905
3  subject 3   m Time1 -0.82619584 0.5993917
4  subject 4   f Time1 -0.95568823 4.4729726
5  subject 5   f Time1 -2.29939525 8.0101254
6  subject 1   m Time2 -0.37914702 3.6387589
7  subject 2   m Time2  0.26759909 4.9027533
8  subject 3   m Time2  0.07727621 2.1848642
9  subject 4   f Time2 -0.08613439 5.8747074
10 subject 5   f Time2 -0.02743044 4.3963938
11 subject 1   m Time3  0.07176053 3.7959496
12 subject 2   m Time3  0.46463917 5.2494579
13 subject 3   m Time3 -0.68764512 2.2639503
14 subject 4   f Time3 -0.56670061 2.3361909
15 subject 5   f Time3  1.70731774 5.8345116

Быстрый способ воспроизвести фрейм данных (DF).

DF<-data.frame(id=rep(paste("subject", 1:5, sep=" "), 3),              
               sex=rep(c("m","m","m","f","f"), 3),                     
               time=c(rep("Time1",5), rep("Time2",5), rep("Time3",5)), 
               score1=rnorm(15), score2=abs(rnorm(15)*4))              

Я могу решить проблему длинного и широкого для двух измеренных переменных с повторными измерениями, используя функцию reshape из базы, но я надеялся на plyr или reshape2/1 ответ, так как эти пакеты, как правило, гораздо более интуитивно понятны для меня.Если у вас есть какие-то другие решения, предложите их, поскольку обучение будет отличным.

Решение из базы:

wide <- reshape(DF, v.names=c("score1", "score2"), idvar="id",         
                timevar="time", direction="wide")                      
wide   

Ответы [ 2 ]

12 голосов
/ 19 ноября 2011

Я думаю, что это сделает это:

library(reshape)
m <- melt(DF)

Самое простое, но время и оценка находятся в порядке, обратном вашему примеру (в случае, если это имеет значение)

cast(m,id+sex~...)

Или более точно:

cast(m,id+sex~variable+time)

Вы можете сократить это до однострочного:

recast(DF,id+sex~...)

Если вам нравится, вы можете использовать более новый пакет reshape2 вместо reshape, заменив cast на dcast (версия recast, включенная в reshape2, не дает желаемого результата.)

2 голосов
/ 23 декабря 2015

Ответ Бена великолепен, учитывая дату, когда был задан этот вопрос.Однако следует отметить, что функция dcast, включенная в более поздние версии «data.table», может обрабатывать подобные проблемы без необходимости сначала melt данных.Таким образом, это был бы более эффективный подход к использованию.

library(data.table)
dcast(as.data.table(DF), id + sex ~ time, value.var = c("score1", "score2"))
##           id sex score1_Time1 score1_Time2 score1_Time3 score2_Time1 score2_Time2 score2_Time3
## 1: subject 1   m   0.78213630   -0.1557955  -0.10278773    1.5771598     1.013447    1.4583278
## 2: subject 2   m   0.07456498   -1.4707524   0.38767161    0.2372536     2.787854    3.0741317
## 3: subject 3   m  -1.98935170   -0.4781501  -0.05380504    4.4001015     2.226653    0.4493848
## 4: subject 4   f   0.61982575    0.4179416  -1.37705956    3.0527030     2.755023    3.5244309
## 5: subject 5   f  -0.05612874    1.3586796  -0.41499456    0.6580944     2.829981    1.5924235
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...