Lucene - какой анализатор использовать, чтобы избежать предлогов - PullRequest
1 голос
/ 28 марта 2011

Я использую стандартный анализатор Lucene для разбора текста. однако он возвращает предлоги, а также такие слова, как «я», «the», «и т. д.». Можно ли использовать анализатор, который не возвращает эти слова?

Спасибо

1 Ответ

3 голосов
/ 28 марта 2011

StandardAnalyzer использует StopFilter .

По умолчанию слова в STOP_WORDS_SET исключены. Если этого недостаточно, есть конструкторы, которые позволяют вам передать список стоп-слов, которые должны быть удалены из потока токенов. Вы можете предоставить список, используя File, Set или Reader.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...