Я пытаюсь выяснить, каков наилучший алгоритм для нахождения самого длинного общего суффикса в большом наборе данных строк (например, 1 млн. Строк, каждые 50 символов).Именно задача состоит в том, чтобы идентифицировать адаптер в этом наборе последовательностей ДНК.
Мой текущий подход - «Обобщенное дерево суффиксов» , но в какой-то момент я столкнулся с проблемами с памятью.Так есть ли какой-нибудь другой алгоритм, лучше подходящий для такого большого набора данных?