Представьте себе длинную строку символов:
"AATTAATCTATATATTGAAATGGGGCCCCAATTTTCCCAAATC ...."
Я определяю 4 строки:
"AAT"
"ATG"
"TTT"
"ATC"
Моя миссия - найти «конечную точку» для каждой строки «AAT» в длинной строке символов. Моими конечными точками являются три последние строки «ATG», «TTT», «ATC», что означает, что мне нужно найти индекс моей начальной позиции «AAT» для моей конечной позиции, которая может быть либо «ATG», «TTT». "или" УВД ". Мне сказали продвинуться по шагам 3, но я не уверен, как это сделать.
Я пытался сделать это:
open1=open(<text>)
u=open1.read()
string1="AAT
while True:
p=u.find(string1,p)
p=p+1
mylist.append(p)
print mylist
, который будет печатать расположение строк "ATG" в моем текстовом файле. Я не уверен, как двигаться дальше. Я думаю, что я мог бы найти позиции других строк, но как мне создать функцию, которая начинается с "ATG" и останавливается, пока не встретит одну из конечных точек ??
Надеюсь, это как-то понятно