Lucene часть: 123 против части 123 против части123 - PullRequest
1 голос
/ 29 марта 2020

Я не слишком знаком с Lucene, поэтому мои извинения, если это не ясно, или я перепутал мои термины / номенклатуру.

Так что у меня есть требование, где поле, содержащее текст (пример часть: 123) должна быть найдена через:

  • часть: 123
  • часть 123
  • часть123

Теперь я понимаю, что StandardAnalyzer разбивает слово «часть: 123» на термины «часть» и «123».

Итак, я могу искать с частью: 123 или частью 123 , но поскольку они представляют собой два разных термина, «part123» не сработает.

Мне кажется, что мне также нужно было бы заставить индексатор добавить еще один термин, где оба они объединены, поэтому быть "частью", "123", "частью123".

Это правильный путь для достижения sh этого - и кто-нибудь знает, как я go о реализации этого?

Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...