Lucene для выполнения сходства документов - PullRequest
2 голосов
/ 13 января 2012

Я сделал код, чтобы найти сходство между двумя документами, найдя их tf, а затем их значения косинуса.Но когда я смотрел на стандартные примеры по lucene, в каждой программе использовался индекс.Мой процесс включает сравнение между одним справочным документом и другими документами из папки.

Как вы думаете, я должен использовать индексирование?

1 Ответ

1 голос
/ 16 января 2012

оформить заказ MoreLikeThis class.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...