Какой тип поля Solr обеспечивает базовый поиск по шаблону? - PullRequest
0 голосов
/ 11 марта 2019

Я разместил документ со значением поля «Ананасовый торт с ног на голову». Я хочу получить хиты для pineapple, pine*, *side, pi?????le, upside down и т. Д. Я выбрал text_en, который не находит *side, ни pi?????le.

Что из коробки тип поля даст мне хиты для всего вышеперечисленного?

Я использую Solr 7.6.

1 Ответ

1 голос
/ 11 марта 2019

Если вы хотите сохранить все токены как есть (как я прокомментировал ваш предыдущий вопрос по этому поводу, тип text_en содержит стеммер), используйте тип поля только с WhitespaceTokenizer и LowercaseFilter. Вам нужно определить это поле самостоятельно.

Полагаю, вы можете использовать text_general, чтобы получить достаточно приличный ответ (он использует StandardTokenizer, поэтому он разделится на несколько больше случаев, чем просто пробел).

Причина в том, что поиск по шаблону происходит без большей части обработки (так как невозможно выполнить правильную обработку стемминга, разбиения и т. Д., Когда у вас нет полного токена), поэтому любой поиск по шаблону будет против сгенерированного список токенов после обработки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...