BioPython: как выполнить синтаксический анализ по ключу «Локус» в GenBank - PullRequest
0 голосов
/ 31 октября 2019

У меня есть файл Genbank, содержащий ряд последовательностей. У меня есть второй текстовый файл, который содержит имена этих последовательностей, а также некоторую другую информацию о них, в TSV, который я прочитал как кадр данных pandas. Я использовал функцию .sample для случайного выбора имени из этих данных, которому я присвоил переменную n_name, как показано в блоке кода ниже.

n = df_bp_pos_2.sample(n = 1)
n_value = n.iloc[:2]
n_name = n.iloc[:1]

n_name соответствует имени локуса в файле genbank и является точным. Я пытаюсь проанализировать файл genbank и извлечь последовательность, содержащую locus = n_name. Файл genbank называется all.gb. У меня есть:

from Bio import SeqIO
for seq_record in SeqIO.parse("all.gb", "genbank"):

Но я не слишком уверен, какой должна быть следующая строка или 2, для анализа по локусу? Есть идеи?

...