Так работает FASTA:
- Найдите все тождества k-длины, затем найдите локально схожие регионы, выбрав эти плотные с тождествами k-слов (то есть много k-слов, без слишком большого промежутка между ними). Используются лучшие десять начальных областей .
- Начальные области пересчитываются по их длине путем применения матрицы замещения обычным способом. Оптимально оцениваются субрегионы.
- Создание выравнивания обрезанных начальных областей с использованием динамического программирования с штрафом за пробел 20. Области со слишком низким показателем не включены.
- Оптимизация выравнивания из 3) с использованием «полосного» динамического программирования (Смит-Уотерман). Это динамическое программирование, ограниченное полосой шириной 32 остатка вокруг исходного выравнивания, что экономит пространство и время по сравнению с полным динамическим программированием.
Если исходных областей недостаточно для формирования выравнивания в 3), лучший результат из 2) можно использовать для ранжирования последовательностей по сходству. Для этой цели также могут использоваться оценки из 3) и 4).
К сожалению, мое учреждение не имеет доступа к оригинальной бумаге FASTA, поэтому я не могу предоставить исходные значения различных параметров, упомянутых выше.