Question

Я использую стандартный анализатор Lucene для разбора текста. однако он возвращает предлоги, а также такие слова, как «я», «the», «и т. д.». Можно ли использовать анализатор, который не возвращает эти слова?

Спасибо

dbyrne · Answer 1 · 28 марта 2011

StandardAnalyzer использует StopFilter .

По умолчанию слова в STOP_WORDS_SET исключены. Если этого недостаточно, есть конструкторы, которые позволяют вам передать список стоп-слов, которые должны быть удалены из потока токенов. Вы можете предоставить список, используя File, Set или Reader.

Lucene - какой анализатор использовать, чтобы избежать предлогов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Lucene - какой анализатор использовать, чтобы избежать предлогов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов