Lucene Index | Проблема со словами, имеющими апостроф! - PullRequest
2 голосов
/ 29 января 2010

Когда я выполняю поиск слов, подобных Баллантайну, в индексе отображаются документы, у которых "" есть только несколько результатов поиска.

Я хотел бы видеть только те документы, которые содержат полное слово Ballantine's, как оно есть в документе.

Как я могу изменить свой поисковый запрос? Изменение индекса сейчас очень сложно для меня. Как я уже проиндексировал 3 миллиона документов. Переиндексация занимает много времени.

Пожалуйста, совет!

Спасибо -Subas

Ответы [ 2 ]

1 голос
/ 05 февраля 2010

Вы можете проверить свой индекс, если он содержит слова, индексированные с помощью 's' с взятием по имени Luke (требуется среда выполнения Java): http://www.getopt.org/luke/

0 голосов
/ 29 января 2010

Одно предложение - не проверено.

  1. Дамп всех ваших токенов из вашего индекса: содержит ли он 'S' самостоятельно?
  2. Если это так, вы можете создать span-запрос, который ищет слова "word" + "s"?
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...