Насколько я понимаю, пример демонстрационного IndexFiles в каталоге вкладов Lucene создаст инвертированный индекс из терминов документа в соответствующие пути к документам.
Мне было интересно, есть ли способ добавить термин частотав каждом документе также указатель.
Другими словами (если я правильно понимаю) исходное сопоставление: термин -> список (путь к документам) термин -> список (путь к документу,частота термин в этом документе)
Есть ли способ достичь этого?В настоящее время я подсчитываю частоту терминов на лету, открывая каждый путь к документу в java, а затем подсчитываю термины.Существуют огромные накладные расходы, поскольку потенциально могут открываться и обрабатываться сотни документов.