Мне нужно получить модель векторного пространства (с взвешиванием tf-idf) из результатов запроса на lucene и не могу понять, как это сделать. Кажется, это должно быть просто, и на этом этапе, возможно, один из вас, ребята, может указать мне правильное направление.
Я давно пытался понять, как это сделать, и либо я еще не понял, как прочитанные материалы - это то, что мне нужно (более чем вероятно), либо решение не было отправил к моей конкретной проблеме. Я даже пытался вычислить VSM непосредственно из результатов запроса, но мое решение имеет ужасную сложность.
Изменить: Для всех, кто сталкивается с этим, есть решение @ гораздо более ясный вопрос здесь То, что мне нужно, можно получить с помощью метода IndexReader.getTermFreqVector (String field, int docid).
К сожалению, это не работает для меня, так как индекс, над которым я работаю, не сохранил термин частотные векторы, поэтому я думаю, что я все еще ищу дополнительную помощь в этом!