Файл подстроки мультифакторный с использованием Python - PullRequest
0 голосов
/ 11 марта 2019

Я пытаюсь извлечь последовательности из мультифакторного файла с позиций 2 до 8 (семена микроРНК). Для этого я написал небольшой скрипт на Python. Сценарий работает, но я не могу написать выходной файл. Может ли кто-нибудь помочь мне или указать мне правильное направление?

Спасибо

Сценарий:

from Bio import SeqIO
for index, record in enumerate(SeqIO.parse("file.fasta","fasta")):
    seed= record.seq[1:8]
    a = (print(">" + record.id + '\n\ + seed)

Выход:

>aga-miR-12417-5p
AGUCGUU
>aga-miR-12418-3p
GUUCGAU
>aga-miR-12419-5p
GCUGUUC

Ответы [ 2 ]

1 голос
/ 12 марта 2019

Вам просто нужно использовать SeqIO.write(), это будет наиболее похоже на вашу текущую структуру:

from Bio import SeqIO

with open("out_file.fasta", "w") as out_f:
    for index, record in enumerate(SeqIO.parse("file.fasta","fasta")):
        record.seq = record.seq[1:8]
        SeqIO.write(record, out_f, "fasta")
0 голосов
/ 12 марта 2019

Если вам просто нужно записать в простой текстовый файл, вы можете сделать:

from Bio import SeqIO
with open('output_file', 'w') as output:
    for index, record in enumerate(SeqIO.parse("file.fasta","fasta")):
        seed= record.seq[1:8]
        output.writeline(">" + record.id)
        output.writeline(seed)
...