Как объединить и удалить столбцы в списке фреймов данных на основе условий - PullRequest
0 голосов
/ 10 февраля 2019

Ниже приведен пример данных, представляющих собой список, содержащий различные кадры данных.Я хочу получить один фрейм данных из него на основе следующих двух условий.

Первый:

  1. Для каждого фрейма данных в начальном столбце списка 1 сохраняйте rbind() столбцы, которыеиметь точно такое же имя столбца, как и предыдущий.В тот момент, когда встречается другое имя столбца, отбросьте этот и все столбцы до последнего.
  2. Например: если столбец 1 называется Banana, то столбец 2 называется Banana, но столбец 3равен Orange, а затем снова столбец 4 равен Banana.Тогда столбцы 1 и 2 будут rbind(), а столбцы 3 и 4. будут удалены.
  3. Другой пример: если столбец 1 называется Banana, то столбец 2 называется Orange, а столбец 3 - Banana, тогда только первый столбец будет сохранен в качестве начального столбца 2, имя столбца будет другим, и мне наплевать на имя столбца 3, даже если оно совпадает с именем столбца 1.

Второе:

  1. После того, как я запустил список фреймов данных с помощью вышеуказанного условия, я хочу объединить все фреймы данных в списке, чтобы получить один фрейм данных, который, я думаю, может быть достигнут с помощью следующего кода.
  2. Здесь lst2 является выводом первого условия.
do.call(rowr::cbind.fill, c(lst2, list(fill = 0)))

Над кодом кредита @ akrun .Любые предложения будут полезны.

Пример данных

list(A = structure(list(`A-DIODE` = c(1.2, 0.4), `A-DIODE` = c(1.3, 
0.6)), row.names = c(NA, -2L), class = "data.frame"), B = structure(list(
    `B-DIODE` = c(1.4, 0.8), `B-ACC1` = c(1.5, 1), `B-ACC2` = c(1.6, 
    1.2), `B-ANA0` = c(1.7, 1.4), `B-ANA1` = c(1.8, 1.6), `B-BRICKID` = c(1.9, 
    1.8), `B-CC0` = c(2L, 2L), `B-CC1` = c(2.1, 2.2), `B-DIGDN` = c(2.2, 
    2.4), `B-DIGDP` = c(2.3, 2.6), `B-DN1` = c(2.4, 2.8), `B-DN2` = c(2.5, 
    3), `B-DP1` = c(2.6, 3.2), `B-DP2` = c(2.7, 3.4), `B-SCL` = c(2.8, 
    3.6), `B-SDA` = c(2.9, 3.8), `B-USB0DN` = 3:4, `B-USB0DP` = c(3.1, 
    4.2), `B-USB1DN` = c(3.2, 4.4), `B-USB1DP` = c(3.3, 4.6), 
    `B-ACC1` = c(3.4, 4.8), `B-ACC2` = c(3.5, 5), `B-ANA0` = c(3.6, 
    5.2), `B-ANA1` = c(3.7, 5.4), `B-BRICKID` = c(3.8, 5.6), 
    `B-CC0` = c(3.9, 5.8), `B-CC1` = c(4L, 6L), `B-DIGDN` = c(4.1, 
    6.2), `B-DIGDP` = c(4.2, 6.4), `B-DN1` = c(4.3, 6.6), `B-DN2` = c(4.4, 
    6.8), `B-DP1` = c(4.5, 7), `B-DP2` = c(4.6, 7.2), `B-SCL` = c(4.7, 
    7.4), `B-SDA` = c(4.8, 7.6), `B-USB0DN` = c(4.9, 7.8), `B-USB0DP` = c(5L, 
    8L), `B-USB1DN` = c(5.1, 8.2), `B-USB1DP` = c(5.2, 8.4), 
    `B-NA` = c(5.3, 8.6), `B-ACC2PWRLKG_0v4` = c(5.4, 8.8), `B-ACC2PWRLKG_0v4` = c(5.5, 
    9), `B-P_IN_Leak` = c(5.6, 9.2)), row.names = c(NA, -2L), class = "data.frame"))

Обновление 1

После @ ØysteinS ответ Я понял, что должно быть и третье условие:

Третье:

  • Если в списке только один столбец в одном из фреймов данныхзатем в родительский фрейм данных будет добавлен только этот столбец.

Ответы [ 2 ]

0 голосов
/ 11 февраля 2019

Одним из простых вариантов будет цикл list, получение идентификатора длины серии имен столбцов, извлечение только тех, которые равны 1, unlist, преобразование в data.frame с именем первого столбца изатем с помощью cbind.fill свяжите list данных. Кадры вместе

library(data.table)
lst1 <- lapply(data, function(x) 
       setNames(data.frame(unlist(x[rleid(names(x)) == 1])), names(x)[1]))
do.call(rowr::cbind.fill, c(lst1, list(fill = 0)))
#    A.DIODE B.DIODE
#1     1.2     1.4
#2     0.4     0.8
#3     1.3     0.0
#4     0.6     0.0
0 голосов
/ 10 февраля 2019

Это должно сделать работу:

data <- list(A = structure(list(`A-DIODE` = c(1.2, 0.4), `A-DIODE` = c(1.3, 
0.6)), row.names = c(NA, -2L), class = "data.frame"), B = structure(list(
    `B-DIODE` = c(1.4, 0.8), `B-ACC1` = c(1.5, 1), `B-ACC2` = c(1.6, 
    1.2), `B-ANA0` = c(1.7, 1.4), `B-ANA1` = c(1.8, 1.6), `B-BRICKID` = c(1.9, 
    1.8), `B-CC0` = c(2L, 2L), `B-CC1` = c(2.1, 2.2), `B-DIGDN` = c(2.2, 
    2.4), `B-DIGDP` = c(2.3, 2.6), `B-DN1` = c(2.4, 2.8), `B-DN2` = c(2.5, 
    3), `B-DP1` = c(2.6, 3.2), `B-DP2` = c(2.7, 3.4), `B-SCL` = c(2.8, 
    3.6), `B-SDA` = c(2.9, 3.8), `B-USB0DN` = 3:4, `B-USB0DP` = c(3.1, 
    4.2), `B-USB1DN` = c(3.2, 4.4), `B-USB1DP` = c(3.3, 4.6), 
    `B-ACC1` = c(3.4, 4.8), `B-ACC2` = c(3.5, 5), `B-ANA0` = c(3.6, 
    5.2), `B-ANA1` = c(3.7, 5.4), `B-BRICKID` = c(3.8, 5.6), 
    `B-CC0` = c(3.9, 5.8), `B-CC1` = c(4L, 6L), `B-DIGDN` = c(4.1, 
    6.2), `B-DIGDP` = c(4.2, 6.4), `B-DN1` = c(4.3, 6.6), `B-DN2` = c(4.4, 
    6.8), `B-DP1` = c(4.5, 7), `B-DP2` = c(4.6, 7.2), `B-SCL` = c(4.7, 
    7.4), `B-SDA` = c(4.8, 7.6), `B-USB0DN` = c(4.9, 7.8), `B-USB0DP` = c(5L, 
    8L), `B-USB1DN` = c(5.1, 8.2), `B-USB1DP` = c(5.2, 8.4), 
    `B-NA` = c(5.3, 8.6), `B-ACC2PWRLKG_0v4` = c(5.4, 8.8), `B-ACC2PWRLKG_0v4` = c(5.5, 
    9), `B-P_IN_Leak` = c(5.6, 9.2)), row.names = c(NA, -2L), class = "data.frame"))

# Use lapply to apply the same function to each data frame in the list.
combined_frames <- lapply(data, function(df){
  first_name <- names(df)[[1]]
  result <- df[, 1, drop = FALSE]
  # Keep adding if name is the same as the first
  if (ncol(df) != 1) {
   for(i in seq(2, length(names(df)), by = 1)){
     if(names(df)[[i]] == names(df)[[1]]){
       result <- rbind(result, df[, i, drop = FALSE])
     } else { 
       # Otherwise, break out of loop
       break
     }
   }
  }
  return(result)
})

# Yes, your suggested code seems to work as expected for the last task
do.call(rowr::cbind.fill, c(combined_frames, list(fill = 0)))
#>   A.DIODE B.DIODE
#> 1     1.2     1.4
#> 2     0.4     0.8
#> 3     1.3     0.0
#> 4     0.6     0.0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...