Индексируйте файл пар терминов в люцене - PullRequest
0 голосов
/ 31 марта 2012

У меня есть коллекция пар количества терминов, которые я хочу проиндексировать в люцене. Есть ли способ сделать это без создания «документа», где у меня есть тиражировал каждый термин столько раз, сколько считать?

Мой запрос также будет иметь аналогичную форму.


Мой вопрос, вероятно, был неясным Я имел в виду, что вместо полного документа у меня есть значения счетчиков терминов. Например, вместо документа "роза есть роза есть роза" у меня есть файл вида:

3 роза 3 это 2

Если у меня есть запрос вида «роза роза», я буду представлять его как роза 2 1

Можно ли использовать lucene для индексации таких данных? И тогда я могу запросить с этим типом запросов?

спасибо!

1 Ответ

1 голос
/ 02 апреля 2012

Это должно быть просто достичь. Просто создайте документ с двумя полями - одно содержит термин, а другое - счет. Вы, вероятно, выиграете от использования NumericField для подсчета.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...