У меня есть данные, состоящие из ДНК, которые хранятся в виде последовательности букв «a», «g», «c» и «t». В своих данных я использовал:
count = data.count('t')
print(count)
в Python, чтобы найти, что 't' появляется 1514710 раз.
Я хочу узнать, сколько раз 't' появляется в последовательных окнах из 10 букв, как показано ниже: пример
Из рисунка я могу сказать, что 't'появляется 3 раза в первом интервале из 10 (т.е. в первом наборе из 10 букв' t 'появляется 3 раза из 10), а' t 'появляется 2 раза во втором наборе из 10 букв.
Я хочу показать номер для каждого окна без добавления новой строки после каждого числа в моем скрипте Python.
Так, например, если мои данные выглядят так:
atgcttgcatgcttgcaaatgcatgcttgcattgcaa
Я очень хочу, чтобы мой вывод Python показывал что-то вроде:
't' appears twice in the first set of 10 letters,
and appears 4 times in the second set of 10 letters,
and so on....
Вот чтоЯ пытался до сих пор:
window_size = 10
windows_length = len(data) // window_size
windows = [data[i:i+windows_length] for i in range(0, len(data), windows_length)]
result = sum(1 if 't' in (x) else 0 for x in windows)
, который показывает 11
Но я не уверен, что это правильный путь. Любая помощь будет оценена. Спасибо.