Как изменить последовательность записи GenBank? - PullRequest
0 голосов
/ 12 марта 2012

То, что я хотел бы сделать, это сделать все непоследовательные последовательности записи GenBank в нижнем регистре в файле генома.

Пока мне удалось получить начальное и конечное расположение белков в gbk. Оттуда я делаю следующее:

start = feature.location.nofuzzy_start
end = feature.location.nofuzzy_end
gb_record.seq[start:end]

Теперь у меня есть начальное и конечное местоположение последовательности в геноме. Но как мне изменить файл генома? gb_record.seq[start:end].lower() или что-то подобное не сработало.

Когда я назначаю gb_record.seq = gb_record.seq[start:end].lower, очевидно, что происходит ошибка, когда я заменяю файл генома. Есть идеи?

1 Ответ

1 голос
/ 02 апреля 2012

Bio.Seq.Seq объекты имеют метод lower(), который будет делать то, что вы ищете.

Отработав ваш код, вы получите:

seq_lower = gb_record.seq.lower()

После этого вы сможете использовать модуль SeqIO для записи строчных последовательностей в файл.

from Bio import SeqIO

with open("example.fasta", 'w') as handle:
    SeqIO.write(lower_records, handle, 'fasta')
...