Как я могу рассчитать базовые частоты выравнивания с Bio python? - PullRequest
0 голосов
/ 01 мая 2020

Я только что нашел Био python и борюсь с расчетом базовых частот.

Мой пример выравнивания - это файл fastta под названием test.fasta:

> s1
CAGGTAGCC
> s2
CCGGTCAGA
> s3
AGGGTTTGA
> s4
TTGGTGAGG
> s5
CAAGTATGA
> s6
ACTGTATGC
> s7
CTGGTAACC
> s8
TATGTACTG
> s9
GCTGTGAGA
> s10
CAGGTGGGC
> s11
TCAGTGAGA
> s12
GGGGTGAGT
> s13
TGGGTATGT
> s14
GAGGTGAGA
> s15
CAGGTGGAG

Это то, что я получил до сих пор:

from Bio import AlignIO
alignment = AlignIO.read(open("test.fasta"), "fasta")
sequences = [record.seq for record in alignment]

Мой следующий шаг будет считать базы на позицию, но я не знаю, как извлечь все базы на позицию с помощью Bio python.

Кроме того, я нашел глубоко внутри Bio python метод " _get_letter_freqs ", который, кажется, делает то, что я хочу, но я не знаю, как получить к нему доступ. Кто-нибудь знает?

Спасибо за вашу помощь!

...