Как преобразовать набор быстрых последовательностей в набор строк X в R - PullRequest
0 голосов
/ 28 марта 2020

Я изо всех сил пытаюсь преобразовать набор последовательностей fasta в набор XStrings или DNAstrings.

Я пытался прочитать мой файл fasta (с несколькими последовательностями) в список последовательностей с чтением. FASTA. Если бы я работал только с одной последовательностью, я мог бы преобразовать ее в DNAString (с функцией DNAString), но, поскольку у меня более одной последовательности, я этого не добиваюсь.

Например:

my_sequences<-read.fasta(sequences.fasta)
my sequences 

$`1:20000-20009`
[1] "agtcgctag"
attr(,"name")
[1] "1:20000-20009"
attr(,"Annot")
[1] ">1:20000-20009"
attr(,"class")
[1] "SeqFastadna"

$`1:30000-30010`
[1] "aggggggggggca"
attr(,"name")
[1] "1:30000-30010"
attr(,"Annot")
[1] "1:30000-30010"
attr(,"class")
[1] "SeqFastadna"

.
.
.

Теперь я не могу преобразовать этот набор в набор XStrings или DNAStrings

1 Ответ

0 голосов
/ 28 марта 2020

Просто используйте readDNAStringSet в Biostrings:

my_sequences<-readDNAStringSet(sequences.fasta)

Например:

fa = c(">1:20000-20009","agtcgctag",">1:30000-30010","aggggggggggca")
writeLines(fa,"test.fa")
library(Biostrings)
my_sequences<-readDNAStringSet("test.fa")

my_sequences
  A DNAStringSet instance of length 2
    width seq                                               names               
[1]     9 AGTCGCTAG                                         1:20000-20009
[2]    13 AGGGGGGGGGGCA                                     1:30000-30010

Каждое подмножество является DNAString:

my_sequences[[1]]
  9-letter "DNAString" instance
seq: AGTCGCTAG
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...