Отображение читаемых человеком наиболее часто индексируемых терминов с использованием стебельного поля с граненым поиском Solr - PullRequest
1 голос
/ 12 марта 2012

Мы планируем использовать Solr, чтобы показывать пользователям «n» наиболее часто употребляемых терминов из поля, и мы хотим применить основание, чтобы сгруппировать аналогичные термины.

Теперь нам нужно показать условия пользователям, но основанные на них термины не всегда удобочитаемы. Есть ли какой-нибудь способ получить пример исходных терминов, которые могут быть использованы для показа пользователю?

Единственное решение, которое мы можем придумать, - это запросить два разных поля, одно с основами, а другое без, а затем выполнить сопоставление самостоятельно. Но мы думаем, что это будет дорого (два запроса) и может быть подвержено ошибкам (сопоставление может привести к ошибкам).

Есть ли другой способ реализовать это в Solr? Заранее спасибо.

1 Ответ

2 голосов
/ 12 марта 2012

Stemming применяется как во время запроса , так и время индекса, поэтому я не думаю, что есть простой способ выполнить то, что вы пытаетесь сделать. Тем не менее, в зависимости от количества результатов в вашей базе данных может быть возможно сделать это, используя комбинацию огранки и выделения. Выделенный термин будет всем совпадающим термином, а не основанным термином (так, например, термином «стебель» может быть «связанный», но выделенными терминами будут «связанный», «ассоциация», «ассоциации» и т. Д.). Возможно, вы могли бы сделать следующее:

?q=keyword&facet=true&facet.field=myfield&&facet.limit=20hl=true&hl.fl=myfield&hl.fragsize=0&rows=10

Получение 10 строк и проверка выделенных результатов (по умолчанию они подсвечиваются с помощью тегов <em> </em>, но вы можете изменить это с помощью hl.simple.pre и hl.simple.post - например, с помощью &hl.simple.pre=[&hl.simple.post=] будет оберните совпадающие термины в квадратные скобки), по крайней мере, следует привести образец «оригинальных» совпадающих терминов. hl.fragsize=0 возвращает все поле вместе с выделением.

Надеюсь, это поможет. Подробнее о выделении параметров вы можете прочитать здесь: http://wiki.apache.org/solr/HighlightingParameters

...