У меня есть текстовый файл, содержащий несколько быстрых последовательностей (и я готов проанализировать последовательности вместе с именами генов, особенно. Не могли бы вы помочь с выбором последовательностей с указанными c именами в заголовке. Спасибо
Исходные данные в текстовом файле.
lcl | NC_045512.2_gene_6 [gene = ORF6] [locus_tag = GU280_gp06] [db_xref = GeneID: 43740572] [location = 27202..27387] [gbkey = Gene] ATGTTTCATCTCGTTGACTTTCAGGTTACTATAGCAGAGATATTACTAATTATTATGAGGACTTTTAAAG
Ожидаемые данные после обработки в python 1009
1011 * orf6 ATGTTTCATCTCGTTGACTTTCAGGTTACTATAGCAGAGATATTACTAATTATTATGAGGACTTTTAAAG
Я использовал это, и я был удалось получить
***from Bio import SeqIO
for record in SeqIO.parse("mytext.txt", 'fasta'):
print(record.name)
print(record.seq)***
Полученные результаты были такими:
lcl | NC_045512.2_gene_6 ATGTTTCATCTCGTTGACTTTCAGGTTACTATAGCAGAGATATTACTAATTATTATGAGGACTTTTAAAG