Мне интересно, как лучше всего найти шаблоны в произвольной строке и посчитать их, чтобы получить наиболее распространенные.
По сути, у меня есть временной ряд, который я перевел в буквы конечного алфавита(допустим, 20 букв), создавая огромную строку.Каков наилучший способ найти и посчитать шаблоны?Параметры можно использовать для ограничения количества символов для поиска в качестве шаблона, например, минимум 4, максимум 30 букв для шаблона.
Являются ли деревья суффиксов вариантом?Или есть какой-нибудь метод анализа данных, который может это сделать?