Я только что нашел Био python и борюсь с расчетом базовых частот.
Мой пример выравнивания - это файл fastta под названием test.fasta:
> s1
CAGGTAGCC
> s2
CCGGTCAGA
> s3
AGGGTTTGA
> s4
TTGGTGAGG
> s5
CAAGTATGA
> s6
ACTGTATGC
> s7
CTGGTAACC
> s8
TATGTACTG
> s9
GCTGTGAGA
> s10
CAGGTGGGC
> s11
TCAGTGAGA
> s12
GGGGTGAGT
> s13
TGGGTATGT
> s14
GAGGTGAGA
> s15
CAGGTGGAG
Это то, что я получил до сих пор:
from Bio import AlignIO
alignment = AlignIO.read(open("test.fasta"), "fasta")
sequences = [record.seq for record in alignment]
Мой следующий шаг будет считать базы на позицию, но я не знаю, как извлечь все базы на позицию с помощью Bio python.
Кроме того, я нашел глубоко внутри Bio python метод " _get_letter_freqs ", который, кажется, делает то, что я хочу, но я не знаю, как получить к нему доступ. Кто-нибудь знает?
Спасибо за вашу помощь!