Я сделал код, чтобы найти сходство между двумя документами, найдя их tf, а затем их значения косинуса.Но когда я смотрел на стандартные примеры по lucene, в каждой программе использовался индекс.Мой процесс включает сравнение между одним справочным документом и другими документами из папки.
Как вы думаете, я должен использовать индексирование?