Группировать кадры данных, хранящиеся в списке, в отдельные новые кадры данных - PullRequest
0 голосов
/ 20 декабря 2018

У меня есть список (dflist), который содержит кадры данных (dfX), которые содержат измерения для набора образцов (например, образцы 1-3; samp).Каждый кадр данных сам содержит измерения для конкретной выборки, измеренные с использованием определенного прибора (например, приборы 1-3; inst).Например, информационный кадр 1 содержит измерения от прибора 1 для образца 1, информационный кадр 2 содержит измерения от прибора 2 для образца 1, информационный кадр 3 содержит измерения от прибора 1 для образца 3 и т. Д.

> a1 <- c('a1', 'b1', 'c1')
> a2 <- c('a2', 'b2', 'c2')
> a3 <- c('a3', 'b3', 'c3')
> a4 <- c('a4', 'b4', 'c4')
> b1 <- c(1:3)
> b2 <- c(4:6)
> b3 <- c(7:9)
> b4 <- c(10:12)
> c1 <- c('samp1', 'samp1', 'samp1')
> c2 <- c('samp1', 'samp1', 'samp1')
> c3 <- c('samp2', 'samp2', 'samp2')
> c4 <- c('samp2', 'samp2', 'samp2')
> d1 <- c('inst1', 'inst1', 'inst1')
> d2 <- c('inst2', 'inst2', 'inst2')
> d3 <- c('inst1', 'inst1', 'inst1')
> d4 <- c('inst2', 'inst2', 'inst2')
> df1 <- data.frame(a1, b1, c1, d1)
> df2 <- data.frame(a2, b2, c2, d2)
> df3 <- data.frame(a3, b3, c3, d3)
> df4 <- data.frame(a4, b4, c4, d4)
> nams <- c('Reads', 'Mean_Val', 'Samp', 'Inst')
> dflist <- list(df1, df2, df3, df4)
> dflist <- lapply(dflist, setNames, nm=nams)
> dflist
[[1]]
  Reads Mean_Val  Samp  Inst
1    a1        1 samp1 inst1
2    b1        2 samp1 inst1
3    c1        3 samp1 inst1

[[2]]
  Reads Mean_Val  Samp  Inst
1    a2        4 samp1 inst2
2    b2        5 samp1 inst2
3    c2        6 samp1 inst2

[[3]]
  Reads Mean_Val  Samp  Inst
1    a3        7 samp2 inst1
2    b3        8 samp2 inst1
3    c3        9 samp2 inst1

[[4]]
  Reads Mean_Val  Samp  Inst
1    a4       10 samp2 inst2
2    b4       11 samp2 inst2
3    c4       12 samp2 inst2

То, что я хотел бы сделать, это циклически пройти по списку и объединить кадры данных, содержащие измерения для одного и того же образца (т. Е. Объединить df s на samp), чтобы получить следующий вывод:

[[1]]
  Reads Mean_Val  Samp  Inst
1    a1        1 samp1 inst1
2    b1        2 samp1 inst1
3    c1        3 samp1 inst1
4    a2        4 samp1 inst2
5    b2        5 samp1 inst2
6    c2        6 samp1 inst2

[[2]]
  Reads Mean_Val  Samp  Inst
1    a3        7 samp2 inst1
2    b3        8 samp2 inst1
3    c3        9 samp2 inst1
4    a4       10 samp2 inst2
5    b4       11 samp2 inst2
6    c4       12 samp2 inst2

Я полагаю, что решение будет включать merge и subset, но я действительно понятия не имею, как это сделать, и я зашел в полный тупик, насколько я обеспокоен.

1 Ответ

0 голосов
/ 20 декабря 2018

Вы можете просто собрать их все вместе с:

Reduce(rbind, dflist)

, что дает:

   Reads Mean_Val  Samp  Inst
1     a1        1 samp1 inst1
2     b1        2 samp1 inst1
3     c1        3 samp1 inst1
4     a2        4 samp1 inst2
5     b2        5 samp1 inst2
6     c2        6 samp1 inst2
7     a3        7 samp2 inst1
8     b3        8 samp2 inst1
9     c3        9 samp2 inst1
10    a4       10 samp2 inst2
11    b4       11 samp2 inst2
12    c4       12 samp2 inst2

Если вы хотите поместить его обратно в список информационных фреймов, разделенных выборками (хотяполный кадр данных может быть проще для работы с imho):

df <- Reduce(rbind, dflist)
split(df, df$Samp)

, который возвращает список длины два:

$samp1
  Reads Mean_Val  Samp  Inst
1    a1        1 samp1 inst1
2    b1        2 samp1 inst1
3    c1        3 samp1 inst1
4    a2        4 samp1 inst2
5    b2        5 samp1 inst2
6    c2        6 samp1 inst2

$samp2
   Reads Mean_Val  Samp  Inst
7     a3        7 samp2 inst1
8     b3        8 samp2 inst1
9     c3        9 samp2 inst1
10    a4       10 samp2 inst2
11    b4       11 samp2 inst2
12    c4       12 samp2 inst2

Удачи!

...