Как прочитать последовательность ДНК из текстового файла и сохранить ее в массиве в C? - PullRequest
0 голосов
/ 06 марта 2012

Как прочитать последовательность ДНК из текстового файла на языке C, сохранить ее в массиве и извлечь все подстроки заданной длины, начиная с каждой позиции нуклеотида?

Например, в текстовом файле последовательность выглядит следующим образом

cctgatagacgctatctggctatccaggtacttaggtcctctgtgcgaatctatgcgtttccaaccat

Все подстроки всех начальных позиций

если длина подстроки = 3

cct, ctg, tga, gat, ..., cat

1 Ответ

0 голосов
/ 04 мая 2012

Является ли язык C обязательным для вас?

Я бы перешел на язык более высокого уровня, такой как Python, эта функция будет делать:

from itertools import count

def iterate_fragments(sequence,size):
    """Takes a string and yields pieces of given size."""
    for number in count():
        try: yield sequence[number:number+size]
        except IndexError: break

for fragment in iterate_fragments(dna_sequence,3):
    print fragment

Этот простой код будет печатать каждый фрагмент ДНК(Размер 3 нуклеотидов).

...