Заменить цикл, используя r и grep - PullRequest
0 голосов
/ 06 мая 2018

Я не знаю, что я делаю неправильно - но я рядом - я заставил это сработать однажды ... Кто-нибудь может мне помочь?

Я пытаюсь заменить столбец (plik) указанным словом (в данном случае «A.», если присутствует любое из слов в «dlik»

dlik<-c("Acipenser","cyt b") #list of words to look for
plik<-c("Acipenser oxyrinchus voucher LodgeLab Aoxyrinchus_1 mitochondrion, complete genome",
"Acipenser oxyrinchus voucher LodgeLab Aoxyrinchus_1 mitochondrion, complete genome",
"Acipenser oxyrinchus desotoi mitochondrion, complete genome",
"Acipenser oxyrinchus oxyrinchus mitochondrion, complete genome",
"Acipenser oxyrinchus oxyrinchus isolate ATNNFC-0562 mitochondrion, complete genome",
"Acipenser oxyrinchus oxyrinchus isolate ATNNFC-5C29 mitochondrion, complete genome",
"Acipenser sinensis mitochondrion, complete genome",
"Acipenser sinensis mitochondrion, complete genome",
"Acipenser stellatus complete mitochondiral genome",
"Acipenser stellatus mitochondrion, complete genome",
"Acipenser sturio mitochondrion, complete genome",
"Acipenser sturio mitochondrion, complete genome",
"Polyodon spathula mitochondrial DNA, complete genome"
) #list of words to look in.

Список слов для присмотра (dlik)

  for (i in dlik){
   replace(plik,grep(i,plik),"A.")
  }

Ответы [ 3 ]

0 голосов
/ 06 мая 2018

Это можно сделать намного проще. Нет необходимости в цикле:

sapply (strsplit(plik," "), 
        FUN=function(x){  
              if (any(x %in% dlik)) return("A") else 
                                    return (paste(x, collapse=" "))})

# [1] "A"                                                   
# [2] "A"                                                   
# [3] "A"                                                   
# [4] "A"                                                   
# [5] "A"                                                   
# [6] "A"                                                   
# [7] "A"                                                   
# [8] "A"                                                   
# [9] "A"                                                   
# [10] "A"                                                   
# [11] "A"                                                   
# [12] "A"                                                   
# [13] "Polyodon spathula mitochondrial DNA, complete genome"
0 голосов
/ 06 мая 2018

Мы также можем векторизовать paste, используя вместе 'dlik', используя это в grep до replace тех элементов в 'plik', которые соответствуют индексу

str1 <- paste0("\\b(", paste(dlik, collapse= "|"), ")\\b")
plik[grep(str1, plik)] <- "A."
plik
# [1] "A."                                                  
# [2] "A."                                                  
# [3] "A."                                                  
# [4] "A."                                                  
# [5] "A."                                                  
# [6] "A."                                                  
# [7] "A."                                                  
# [8] "A."                                                  
# [9] "A."                                                  
#[10] "A."                                                  
#[11] "A."                                                  
#[12] "A."                                                  
#[13] "Polyodon spathula mitochondrial DNA, complete genome"
0 голосов
/ 06 мая 2018

Вам необходимо присвоить replace вывод plik:

for (i in dlik){
 plik <- replace(plik,grep(i,plik),"A.")
}
...