Печать названия вида из заголовка файла fasta в выходном файле с использованием biopython (для нескольких файлов) - PullRequest
0 голосов
/ 23 мая 2018

У меня проблемы с печатью вида из моих файлов фаста

Входной файл такой:

>NP_842573.1 chromosomal replication initiator DnaA [Bacillus anthracis str. Ames]
MENISDLWNSALKELEKKVSKPSYETWLKSTTAHNLKKDVLTITAPNEFARDWLESHYSELISETLYDLTGAKLAIRFIIPQSQAEEEIDLPPAKPNAAQDDSNHLPQSMLNPKYTFDTFVIGSGNRFAHAASLAVAEAPAKAYNPLFIYGGVGLGKTHLMHAIGHYVIEHNPNAKVVYLSSEKFTNEFINSIRDNKAVDFRNKYRNVDVLLIDDIQFLAGKEQTQEEFFHTFNALHEESKQIVISSDRPPKEIPTLEDRLRSRFEWGLITDITPPDLETRIAILRKKAKAEGLDIPNEVMLYIANQIDSNIRELEGALIRVVAYSSLINKDINADLAAEALKDIIPNSKPKIISIYDIQKAVGDVYQVKLEDFKAKKRTKSVAFPRQIAMYLSRELTDSSLPKIGEEFGGRDHTTVIHAHEKISKLLKTDTQLQKQVEEINDILK

И часть моего выходного файла выглядит так (GCF...faa - это имя файла)

Y,2.798738459583378,GCF_000014005.1_ASM1400v1_protein.faa

Мне бы очень хотелось напечатать название вида [Bacillus anthracis str.Ames], а также имя файла.

Строка, которую мне нужно отредактировать, такова:

file.write ('\nY,' + str(pY) +  ',' + str(FILE))

, которая печатает пару переменных, а затем строку имени файла.

Но я изо всех сил пытаюсь найти способ вывода строки в квадратных скобках в заголовке файла fasta, используя biopython.

1 Ответ

0 голосов
/ 23 мая 2018

Как указал Chris_Rands в комментариях, ответ:

 record.description.split('[', 1)[1].split(']', 1)[0]
...