Я пытаюсь найти алгоритм, который может показать мне список наиболее часто встречающихся фраз в тексте (фразы, содержащие 1-2-3-4 слова или более). Я пробовал много способов, суффиксный массив, отображение хеша, перевод слова в целочисленное значение хеша и многое другое, но это всегда дает мне сложность O (n ^ 2).
Любая идея для этого решения или доказательство нижней границы?