Мне нужно написать функцию, которая берет файл fasta и подсчитывает в файле диграммы (AT, CG, TT, CC, et c).
Мой для l oop в настоящее время считывает файл построчно и производит подсчет для этой строки. Затем он перезапускает счет в следующей строке. (Все это организовано в словарь)
Я хочу вести подсчет каждой строки, чтобы получить счетчик для всего файла, а не только для отдельных строк.
Это мой код, который я пытаюсь исправить:
dinucleotides = ['AA','AT','AG','AC',
'TA','TT','TG','TC',
'GA','GT','GG','GC',
'CA','CT','CG','CT']
all_counts = {}
with open('short.fasta', 'r') as dna_file:
dna_file.readline()
for line in dna_file:
my_line = line.strip()
for pairs in dinucleotides:
count = my_line.count(pairs)
all_counts[pairs] = count
Спасибо!