Как я могу установить минимальную частоту при создании индекса lucene? - PullRequest
0 голосов
/ 23 августа 2011

Сначала я должен сказать, что я совершенно новичок в Lucene, и поэтому мой вопрос может быть немного глупым.

Что я хотел бы сделать, это создать индекс, содержащий термины, которые встречаются вкак минимум определенное количество раз в документе.Причина, по которой я хотел бы сделать это, заключается в том, что я пытался найти термин, который встречается только два раза, и я получил ноль результатов.Я пытался найти, где я могу настроить этот параметр, но безуспешно.Я посмотрел на индекс, используя Luke , и кажется, что термин не встречается в индексном файле.

Версия Lucene, которую я должен использовать, - 2.0, потому что мне нужно использовать другуюбиблиотека, которая работает только с индексными файлами версии 2.0.

Буду признателен за любую подсказку относительно этой проблемы.Большое спасибо!

1 Ответ

0 голосов
/ 24 августа 2011

Согласно вашему ответу на мой комментарий, вы можете управлять словарем стоп-слов, создав анализатор

StandardAnalyzer (Файловые слова)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...