Solr: подавление фонетических вариаций? - PullRequest
4 голосов
/ 10 февраля 2011

Я пытаюсь выполнить поиск по двум полям, каждое из которых имеет свой собственный коэффициент усиления и включает фонетические вариации, но результаты с этими вариациями всегда должны оцениваться ниже в результатах.В настоящее время проблема заключается в том, что результаты с фонетическим изменением в поле с более высоким усилением предпочтительнее результатов с точным соответствием в поле с более низким усилением.

В schema.xml у меня есть поле с именем «text», содержащеедругие доступные для поиска поля («title» и «description», реализованные с помощью copyField), каждое со своим коэффициентом усиления (определено в dismax SearchHandler в solrconfig.xml).В этом поле есть фильтр solr.PhoneticFilterFactory с DoubleMetaphone на анализаторах «индекс» и «запрос».Насколько я понимаю, фонетические варианты каждого слова добавляются в запрос и в индекс.

Мой вопрос состоит в том, как я могу сказать solr дать отдельный коэффициент усиления (например, 0,3) для фонетических вариаций?

1 Ответ

5 голосов
/ 10 февраля 2011

Одним из возможных решений является создание еще двух полей: предположим, что ваши исходные поля названы «title» и «description».Создайте «title_phonetic» и «description_phonetic» copy_fields и добавляйте только фонетические вариации в эти поля.Затем используйте синтаксический анализатор dismax, чтобы придать этим полям различные значения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...