Самый длинный общий суффикс в большом наборе последовательностей - PullRequest
0 голосов
/ 21 октября 2018

Я пытаюсь выяснить, каков наилучший алгоритм для нахождения самого длинного общего суффикса в большом наборе данных строк (например, 1 млн. Строк, каждые 50 символов).Именно задача состоит в том, чтобы идентифицировать адаптер в этом наборе последовательностей ДНК.

Мой текущий подход - «Обобщенное дерево суффиксов» , но в какой-то момент я столкнулся с проблемами с памятью.Так есть ли какой-нибудь другой алгоритм, лучше подходящий для такого большого набора данных?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...