найти список наиболее часто встречающихся фраз в тексте - PullRequest
0 голосов
/ 16 февраля 2019

Я пытаюсь найти алгоритм, который может показать мне список наиболее часто встречающихся фраз в тексте (фразы, содержащие 1-2-3-4 слова или более). Я пробовал много способов, суффиксный массив, отображение хеша, перевод слова в целочисленное значение хеша и многое другое, но это всегда дает мне сложность O (n ^ 2).

Любая идея для этого решения или доказательство нижней границы?

...