Question

У меня есть файл с несколькими именами, такими:

seq1 seq9 seq3 seq7 seq5 seqi seqn....

и другой файл fasta со всеми моими последовательностями, и мне нужно упорядочить свои последовательности в порядке, указанном в списке выше: например:

>seq1
aaaaa
>seq9
aaaaa
>seq3
aaaaa
>seq7
aaaaa
>seq5
aaaaa
...

Я пробовал это:

input_file = open('concatenate_0035_0042_aa2.fa','r')
output_file = open('result.fasta','a')


liste=['seq1','seq5','seq8' etc]
print(len(liste))
compteur=1
for i in liste:
    record_dict = SeqIO.to_dict(SeqIO.parse("concatenate_0035_0042_aa2.fa", "fasta"))
    print(">",record_dict[i].id,file=output_file,sep="")
    print(record_dict[i].seq,file=output_file)
    compteur+=1
    print(compteur)

output_file.close()
input_file.close()

но на самом деле это занимает слишком много времени.

BioGeek · Answer 1 · 25 апреля 2018

Причина, по которой ваш текущий код занимает слишком много времени, заключается в том, что для каждого идентификатора последовательности в вашем списке вы анализируете свой файл fastta и конвертируете его в dict. Конечно, если ваш файл fasta большой, это дорогостоящее вычисление. Так что сделайте это только один раз:

from Bio import SeqIO

ids = ['seq1', 'seq9', 'seq3', 'seq7', 'seq5'] 
with open('concatenate_0035_0042_aa2.fa') as seqs, open('result.fasta', 'w') as result:
    record_dict = SeqIO.to_dict(SeqIO.parse(seqs, 'fasta'))
    result_records = [record_dict[id_] for id_ in ids]
    SeqIO.write(result_records, result, "fasta")

оператор with open(...) позаботится об автоматическом закрытии файла для вас, когда вы закончите.

распаковать несколько файлов фаста со списком ID (по порядку)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

распаковать несколько файлов фаста со списком ID (по порядку)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы