Question

Я разместил документ со значением поля «Ананасовый торт с ног на голову». Я хочу получить хиты для pineapple, pine*, *side, pi?????le, upside down и т. Д. Я выбрал text_en, который не находит *side, ни pi?????le.

Что из коробки тип поля даст мне хиты для всего вышеперечисленного?

Я использую Solr 7.6.

MatsLindh · Answer 1 · 11 марта 2019

Если вы хотите сохранить все токены как есть (как я прокомментировал ваш предыдущий вопрос по этому поводу, тип text_en содержит стеммер), используйте тип поля только с WhitespaceTokenizer и LowercaseFilter. Вам нужно определить это поле самостоятельно.

Полагаю, вы можете использовать text_general, чтобы получить достаточно приличный ответ (он использует StandardTokenizer, поэтому он разделится на несколько больше случаев, чем просто пробел).

Причина в том, что поиск по шаблону происходит без большей части обработки (так как невозможно выполнить правильную обработку стемминга, разбиения и т. Д., Когда у вас нет полного токена), поэтому любой поиск по шаблону будет против сгенерированного список токенов после обработки.

Какой тип поля Solr обеспечивает базовый поиск по шаблону?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Какой тип поля Solr обеспечивает базовый поиск по шаблону?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы