учитывая текстовый файл FASTA (Rosalind_gc.txt), я должен пройти через каждую запись ДНК и определить процент (%) содержания гуанин-цитозина (GC).
Пример этого:
Пример набора данных:
>Rosalind_6404
CCTGCGGAAGATCGGCACTAGAATAGCCAGAACCGTTTCTCTGAGGCTTCCGGCCTTCCC
TCCCACTAATAATTCTGAGG
>Rosalind_5959
CCATCGGTAGCGCATCCTTAGTCCAATTAAGTCCCTATCCAGGCGCTCCGCCGAAGGTCT
ATATCCATTTGTCAGCAGACACGC
>Rosalind_0808
CCACCCTCGTGGTATGGCTAGGCATTCAGGAACCGGAGAACGCTTCAGACCAGCCCGGAC
TGGGAACCTGCGGGCAGTAGGTGGAAT
Пример вывода:
Rosalind_0808
60.919540
Таким образом, в основном, просматривайте каждую строку, подсчитывайте количество раз, когда G / C появляется, и затем делите это общее количество на длину каждой строки. Моя проблема заключается в том, чтобы узнать, как определить разрывы в коде (т. Е.> Rosalind_6404). Я хотел бы получить пример этого кода без использования Biopython, а также с подходом биопиона.