У меня есть текст около 300 - 500 слов. Кроме того, я получил около 200 тыс. Ключевых слов, и я хочу знать, содержится ли каждое из ключевых слов в тексте. Строка содержит довольно медленно, есть ли способ предварительной обработки строки?
Я думал об использовании SuffixTree, но не уверен, что это лучший выбор.
Кроме того, есть ли хорошие библиотеки для этой задачи? Например, semanticdiscoverytoolkit имеет реализацию суффиксного дерева, но после добавления строки я не могу понять, как искать, содержится ли строка в дереве.
Привет,
Nico