Lucene: используйте SpanTermQuery, чтобы получить результаты для слов со специальными символами - PullRequest
0 голосов
/ 04 апреля 2011

Можно ли искать результаты в Lucene для не символьных слов, например, если я пытаюсь найти результаты для "обработки текста" или "foo-bar". Не похоже, что они рассматриваются как один термин при использовании SpanTermQuery. Я получаю результаты для этого с помощью QueryParser, но не SpanTermQuery. Мне просто интересно, как это работает, какие-либо комментарии / идеи о том, как заставить SpanTermQuery работать на него?

1 Ответ

0 голосов
/ 04 апреля 2011

Я бы рекомендовал взглянуть на то, как настроены токенизаторы и анализаторы вашего поля. Прочитайте javadocs для существующих готовых токенизаторов / анализаторов, чтобы увидеть, соответствует ли один из них вашим потребностям. Если кто-то не отвечает вашим потребностям, вы можете легко расширить и создать свой собственный Tokenizer и / или Analyzer.

http://wiki.apache.org/lucene-java/LuceneFAQ#How_do_I_write_my_own_Analyzer.3F http://lucene.apache.org/java/3_0_3/api/core/org/apache/lucene/analysis/Analyzer.html http://lucene.apache.org/java/3_0_3/api/core/org/apache/lucene/analysis/Tokenizer.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...