Мы можем перебрать list
и извлечь элементы, которые соответствуют подстроке 'OTU' в начале (^
) строки, за которой следуют четыре цифры (\\d{4}
) до конца ($
)строки с grepl
lapply(lst1, function(x) x[grepl("^OTU\\d{4}$", x)])
#$`56`
#[1] "OTU2998"
#$`57`
#[1] "OTU3820"
#$`58`
#[1] "OTU4452"
#$`59`
#[1] "OTU0245" "OTU1234"
ПРИМЕЧАНИЕ. Используя только base R
методы
Или, если мы поклонник Tidyverse, то используйте keep
library(tidyverse)
map(lst1, keep, str_detect, '^OTU\\d{4}$')
данные
lst1 <- list(
`56` = c("OTU2998", "UniRef90_A0A1Z9FS94", "UniRef90_A0A257ESC3", "UniRef90_A0A293NAV3", "UniRef90_A0A2E1NMU8", "UniRef90_A0A2E1NPX9", "UniRef90_A0A2E1NQL1", "UniRef90_A0A2E1NRD2", "UniRef90_X0UC66"),
`57` = c("OTU3820", "UniRef90_A0A1Z9H3N2", "UniRef90_A0A2D5I161", "UniRef90_A0A2E6PRN5"),
`58` = c("OTU4452", "UniRef90_A0A1Z9KBI8", "UniRef90_A0A2E1VTI6", "UniRef90_A0A2G2KCN6", "UniRef90_UPI000BFEC744"),
`59` = c("OTU0245", "UniRef90_A0A1Z9MPM9", "UniRef90_A0A2E2ME98", "UniRef90_A0A2E8X9N7", "OTU1234")
)