Я понимаю, как получить набор документов из объекта Term, но вы можете пойти другим путем, чтобы получить термины / частоты терминов из объекта Document?
Да, можно получить термины из документа, но нет простых API.У IndexReader есть метод getTermFreqVector , где вы можете получить термины в документе.Вам необходимо создать пользовательский TermVectorMapper и передать его getTermFreqVector(). В пользовательском TVMapper термины и их частоты собираются методом map().После возврата getTermFreqVector() термины могут быть получены из пользовательского TVMapper.
getTermFreqVector().
map()
getTermFreqVector()