Стандартный анализатор, не рассматривайте один символ как пунктуацию - PullRequest
1 голос
/ 06 сентября 2010

Я индексирую некоторые данные, в которых символ '@' должен обрабатываться так, как он есть. Мне также нужны все функции, предоставляемые стандартным анализатором (исключая пунктуацию, трейлинг и т. Д.), Но при этом также удаляется @. Есть ли место, где я могу указать, чтобы рассматривать символ как не пунктуацию? Или какой-либо фильтр, который можно использовать с whitespaceTokenizer для получения таких результатов? я знаю, что должен написать свой собственный анализатор для такого требования, но я не хочу пропустить, если есть что-то очень очевидное.

Спасибо, кака

1 Ответ

0 голосов
/ 06 сентября 2010

Нашел этот пост. Спасибо автору.Используйте PatternTokenizerFactory с соответствующими фильтрами.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...