Я пытаюсь найти кодоны STOP и START в наборе данных fasta.
Я все перепробовал, но команда matchpattern (biostring) не работает и не показывает совпадений.
library(seqinr)
library(Biostrings)
rbcs <- read.fasta(file = "rbcS_sequences_full_edited.fasta", as.string = TRUE, set.attributes = FALSE)
rbcsseq <- rbcs[[1]]
rbcs
atg <- lapply(rbcs, function(x) {
string <- BString(paste(x, collapse = ""))
matchPattern("atg", string)
})