У меня есть n документов, и я хочу найти общие слова, которые включены в эти документы.
Например, я хочу сказать, что (n-3) документы включают слово «сеть».
Конечно, я могу сделать это с помощью базовых структур данных, но может быть эффективный алгоритм или способ обработки одних и тех же слов с другим суффиксом.
Есть ли алгоритм для таких целей?
Я незнаком с миром обработки данных. В общем, используется ли термин для поиска сходства между различными документами? Если есть, то я легко сделаю свое исследование.
Спасибо.