Я предполагаю, что ваши последовательности хранятся в SeqIO.Seq
объектах.
Возможно, вы захотите использовать метод ungap
в SeqIO.Seq
. Документация довольно хорошая. ungap()
является лучшим выбором, чем операция замены строки (например, она может вывести символ пробела из алфавита последовательности).
Пример кода:
from Bio import SeqIO
seq_records = SeqIO.parse("input.fasta", format='fasta')
for record in seq_records:
seq_ungapped = record.seq.ungap('-')