Question

Я пытаюсь понять основные шаги алгоритма FASTA при поиске похожих последовательностей последовательности запросов в базе данных.Вот шаги алгоритма:

Определить общие k-слова между I и J
Оценить диагонали с соответствием k-словам, определить 10 лучших диагоналей
Восстановить начальные регионы с помощью матрицы оценок замещения
Соединить начальные регионы, используя пробелы, штрафовать за пробелы
Выполнить динамическое программирование, чтобы найти окончательные выравнивания

Я запутался с3-й и 4-й этапы использования матрицы оценок PAM250 и как «соединиться, используя пробелы».

Может кто-нибудь объяснить мне эти два шага «как можно точнее».Спасибо

reve_etrange · Answer 1 · 03 декабря 2011

Так работает FASTA:

Найдите все тождества k-длины, затем найдите локально схожие регионы, выбрав эти плотные с тождествами k-слов (то есть много k-слов, без слишком большого промежутка между ними). Используются лучшие десять начальных областей .
Начальные области пересчитываются по их длине путем применения матрицы замещения обычным способом. Оптимально оцениваются субрегионы.
Создание выравнивания обрезанных начальных областей с использованием динамического программирования с штрафом за пробел 20. Области со слишком низким показателем не включены.
Оптимизация выравнивания из 3) с использованием «полосного» динамического программирования (Смит-Уотерман). Это динамическое программирование, ограниченное полосой шириной 32 остатка вокруг исходного выравнивания, что экономит пространство и время по сравнению с полным динамическим программированием.

Если исходных областей недостаточно для формирования выравнивания в 3), лучший результат из 2) можно использовать для ранжирования последовательностей по сходству. Для этой цели также могут использоваться оценки из 3) и 4).

К сожалению, мое учреждение не имеет доступа к оригинальной бумаге FASTA, поэтому я не могу предоставить исходные значения различных параметров, упомянутых выше.

Bill Pearson · Answer 2 · 02 марта 2012

Объяснение по существу правильное, но окончательная оптимизация полосы сосредоточена на одном наилучшем выравнивании без разрывов, найденном на шаге 2. Шаг 3 используется просто для улучшения чувствительности при выборе последовательностей, которые получают шаг 4.

Оригинал статьи можно посмотреть здесь: http://faculty.virginia.edu/wrpearson/papers/pearson_lipman_pnas88.pdf

Объяснение алгоритма FASTA

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Объяснение алгоритма FASTA

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы