R преобразование данных - PullRequest
       1

R преобразование данных

4 голосов
/ 24 февраля 2012

У меня есть фрейм данных R, который выглядит следующим образом:

z = as.data.frame(list(Col1=c("a","c","e","g"),Col2=c("b","d","f","h"),Col3=c("1,2,5","3,5,7","9,8","1")))
> z
  Col1 Col2  Col3
1    a    b 1,2,5
2    c    d 3,5,7
3    e    f   9,8
4    g    h     1

(Третий столбец - это текстовый столбец со значениями, разделенными запятыми.) Я хотел бы преобразовать его в фрейм данных, подобный этому:

a    b    1
a    b    2
a    b    5
c    d    3
c    d    5
c    d    7
e    f    9 
e    f    8
g    h    1

Может кто-нибудь предложить способ сделать это с помощью применения?Я близко, используя команду ниже, но это не совсем правильно.Буду также признателен за любые предложения о более эффективных способах сделать это ...

> apply(z,1,function(a){ids=strsplit(as.character(a[3]),",")[[1]];out<-c();for(id in ids){out<-rbind(out,c(a[1:2],id))};return(out)})
[[1]]
     Col1 Col2    
[1,] "a"  "b"  "1"
[2,] "a"  "b"  "2"
[3,] "a"  "b"  "5"

[[2]]
     Col1 Col2    
[1,] "c"  "d"  "3"
[2,] "c"  "d"  "5"
[3,] "c"  "d"  "7"

[[3]]
     Col1 Col2    
[1,] "e"  "f"  "9"
[2,] "e"  "f"  "8"

[[4]]
     Col1 Col2    
[1,] "g"  "h"  "1"

Ответы [ 2 ]

5 голосов
/ 24 февраля 2012

Вы можете использовать ddply.

library(plyr)
ddply(z, c("Col1", "Col2"), summarize, 
  Col3=strsplit(as.character(Col3),",")[[1]]
)
3 голосов
/ 24 февраля 2012

С reshape или reshape2

require(reshape2)
merge(cbind(z[,-3], L1=rownames(z)), melt(strsplit(as.character(z$Col3),",")))

дает

  L1 Col1 Col2 value
1  1    a    b     1
2  1    a    b     2
3  1    a    b     5
4  2    c    d     3
5  2    c    d     5
6  2    c    d     7
7  3    e    f     9
8  3    e    f     8
9  4    g    h     1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...