Question

Я пытаюсь выяснить, каков наилучший алгоритм для нахождения самого длинного общего суффикса в большом наборе данных строк (например, 1 млн. Строк, каждые 50 символов).Именно задача состоит в том, чтобы идентифицировать адаптер в этом наборе последовательностей ДНК.

Мой текущий подход - «Обобщенное дерево суффиксов» , но в какой-то момент я столкнулся с проблемами с памятью.Так есть ли какой-нибудь другой алгоритм, лучше подходящий для такого большого набора данных?

Самый длинный общий суффикс в большом наборе последовательностей

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Самый длинный общий суффикс в большом наборе последовательностей

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы