Биокондуктор имеет множество пакетов для работы с последовательностями ДНК.Установите пакет ShortRead с
source("http://bioconductor.org/biocLite.R")
biocLite("ShortRead")
Загрузите библиотеку и обратитесь к странице справки для readFasta
library(ShortRead)
?readFasta
Найдите шаблон (например, list.files
), который соответствует требуемым файлам fastaчитать и читать все файлы fastta, соответствующие шаблону, в один объект
patt <- "fasta$"
fasta <- readFasta("/my/directory/containing/fasta/files", patt)
Затем записать объект
writeFasta(fasta, "my_destination.fasta")
Но на самом деле R не был бы подходящим инструментом дляобъединение файлов;скорее всего, вы захотите сделать более интересные вещи, некоторые из которых могут быть описаны в виньетках для ShortRead, Biostrings и GenomicRanges
browseVignettes("ShortRead")
browseVignettes("Biostrings")
browseVignettes("GenomicRanges")
Список рассылки Bioconductor - лучшее место, чтобы получитьподдержка пакетов Bioconductor.