Условное подмножество вложенного списка - PullRequest
2 голосов
/ 06 апреля 2020

У меня есть вложенный список, в котором подсписок имеет два списка. Ниже приведен упрощенный вывод этого списка:

nested.list <- list(`1` = structure(list(lengths = c(325L, 18L, 1L, 7L, 1L, 
10L, 1L, 35L, 1L, 1L, 152L, 1L, 1L, 37L, 1L, 33L, 1L, 15L, 2L, 
1L, 47L, 1L, 29L, 107L, 35L, 3L, 6L, 12L, 16L), values = c(1, 
2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 129, 
1, 2, 1, 2, 1, 2, 1)), class = "rle"), `2` = structure(list(lengths = c(19L, 
99L, 1L, 16L, 2L, 24L, 1L, 12L, 1L, 23L, 1L, 2L, 1L, 51L, 1L, 
1L, 2L, 34L, 1L, 15L, 1L, 20L, 1L, 8L, 1L, 18L, 28L, 7L, 105L, 
3L, 23L, 1L, 13L, 1L, 17L, 1L, 31L, 1L, 17L, 6L, 5L, 2L, 18L, 
1L, 20L, 2L, 38L, 21L, 9L, 2L, 89L, 1L, 1L, 2L, 26L, 4L, 1L, 
1L, 1L, 3L, 4L, 6L, 1L, 7L, 1L, 24L), values = c(1, 2, 1, 2, 
1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 
2, 3, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 
2, 3, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2)), class = "rle"), 
    `3` = structure(list(lengths = c(6L, 3L, 14L, 1L, 1L, 1L, 
    1L, 1L, 9L, 2L, 29L, 3L, 11L, 1L, 19L, 1L, 20L, 1L, 2L, 1L, 
    22L, 11L, 2L, 1L, 7L, 2L, 17L, 30L, 3L, 1L, 1L, 1L, 8L, 4L, 
    5L, 1L, 23L, 1L, 11L, 4L, 2L, 1L, 29L, 2L, 10L, 1L, 17L, 
    6L, 12L, 1L, 22L, 22L, 8L, 3L, 2L, 13L, 1L, 1L, 1L, 83L, 
    1L, 24L, 1L, 24L, 1L, 7L, 6L, 4L, 1L, 2L, 1L, 37L, 1L, 32L, 
    33L, 5L, 1L, 29L, 6L, 7L, 16L, 2L, 16L, 1L, 1L, 1L, 3L, 1L, 
    18L, 1L, 9L, 4L, 3L, 1L, 21L, 14L, 12L, 1L, 33L), values = c(2, 
    1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 
    2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 
    1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 3, 1, 129, 1, 2, 1, 2, 
    1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 3, 1, 2, 
    1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 
    2, 1, 2)), class = "rle"))

Это было сгенерировано lapply(another.list, function(x) rle(x)) в случае, если это важно.

В любом случае, я знаю, как извлечь отдельные элементы, выполнив что-то вроде nested.list[[1]]["lengths"]. Однако я ищу условно подмножество каждой пары списков, чтобы у меня были все lengths >= 6 и values == 2.

Я искал предыдущие ответы и нашел примеры, такие как lapply(list, [, list$value == 2), но они не распространяются на мое дело, и я не смог их получить.

Я предполагаю, что должен быть простой способ сделать это, которого мне не хватает.

Ответы [ 3 ]

1 голос
/ 06 апреля 2020

Может быть, мы можем сделать

lapply(nested.list, function(x)  {
    i1 <- x$lengths >=6 & x$values == 2
   within.list(x, {lengths <- lengths[i1]; values <- values[i1]}) })
#$`1`
#Run Length Encoding
#  lengths: int [1:9] 18 7 10 35 37 33 15 107 12
#  values : num [1:9] 2 2 2 2 2 2 2 2 2

#$`2`
#Run Length Encoding
#  lengths: int [1:23] 99 16 24 12 23 51 34 15 20 8 ...
#  values : num [1:23] 2 2 2 2 2 2 2 2 2 2 ...

#$`3`
#Run Length Encoding
#  lengths: int [1:33] 6 14 9 29 11 19 20 22 7 17 ...
#  values : num [1:33] 2 2 2 2 2 2 2 2 2 2 ...

Если мы хотим, чтобы data.frame выводился в каждом list

lapply(nested.list, function(x) 
      subset(as.data.frame(unclass(x)), lengths >=6 & values == 2))
1 голос
/ 06 апреля 2020

Преобразование класса nested.list из list в data.table и подмножества значений из таблицы данных.

library('data.table')
nested.list <- rbindlist(lapply(seq_along(nested.list), function(x) {
  y <- do.call('cbind.data.frame', nested.list[[x]])
  y$id <- x
  names(y) <- c('lengths', 'values', 'id')
  y}
  ))
out <- nested.list[lengths >= 6 & values == 2, ]
head(out)
#    lengths values id
# 1:      18      2  1
# 2:       7      2  1
# 3:      10      2  1
# 4:      35      2  1
# 5:      37      2  1
# 6:      33      2  1
1 голос
/ 06 апреля 2020

Вот базовая версия R, которая возвращает data.frames.

lapply(nested.list,function(x){
  y <- data.frame(lengths = x$length, values = x$values);
  y[y$lengths >= 6 & y$values ==2,]})
#$`1`
#   lengths values
#2       18      2
#4        7      2
#6       10      2
#...
#
#$`2`
#   lengths values
#2       99      2
#4       16      2
#6       24      2
#...
#
#$`3`
#   lengths values
#1        6      2
#3       14      2
#9        9      2
#...
...