Lucene - Как отбросить числовые термины при индексации? - PullRequest
1 голос
/ 03 февраля 2011


Используя StandardAnalyzer , мой Lucene также содержит числовые термины (т. Е. "200").Так что число терминов в моем индексе слишком велико.
Кто-нибудь знает, существует ли Анализатор или Токенизатор, который отбрасывает числовые термины?
Если нет, есть ли какой-нибудь простой способ получить его?

1 Ответ

3 голосов
/ 03 февраля 2011

Антонио, я предлагаю вам попробовать SimpleAnalyzer .

Если это не работает для вас, возможно, вам придется написать собственный анализатор.

...