У меня есть файл Genbank
, содержащий ряд последовательностей. У меня есть второй текстовый файл, который содержит имена этих последовательностей, а также некоторую другую информацию о них, в TSV, который я прочитал как кадр данных pandas. Я использовал функцию .sample для случайного выбора имени из этих данных, которому я присвоил переменную n_name
, как показано в блоке кода ниже.
n = df_bp_pos_2.sample(n = 1)
n_value = n.iloc[:2]
n_name = n.iloc[:1]
n_name
соответствует имени локуса в файле genbank
и является точным. Я пытаюсь проанализировать файл genbank
и извлечь последовательность, содержащую locus = n_name
. Файл genbank
называется all.gb
. У меня есть:
from Bio import SeqIO
for seq_record in SeqIO.parse("all.gb", "genbank"):
Но я не слишком уверен, какой должна быть следующая строка или 2, для анализа по локусу? Есть идеи?