Итак, я пытаюсь решить эту проблему, когда мне нужно найти наиболее частую 6-буквенную строку в некоторых строках Python, поэтому я понимаю, что можно сделать что-то вроде этого:
>>> from collections import Counter
>>> x = Counter("ACGTGCA")
>>> x
Counter({'A': 2, 'C': 2, 'G': 2, 'T': 1})
Теперьданные, которые я использую - это файлы ДНК, а формат файла выглядит примерно так:
> name of the protein
ACGTGCA ... < more sequences>
ACGTGCA ... < more sequences>
ACGTGCA ... < more sequences>
ACGTGCA ... < more sequences>
> another protein
AGTTTCAGGAC ... <more sequences>
AGTTTCAGGAC ... <more sequences>
AGTTTCAGGAC ... <more sequences>
AGTTTCAGGAC ... <more sequences>
Мы можем начать с одного белка за раз, но как изменить один блок блока?приведенный выше код для поиска наиболее часто встречающегося 6-символьного строкового шаблона?Благодарю.