Вернуть основанное на слове слово - PullRequest
1 голос
/ 03 июня 2011

В нашем поиске по Solr мы имеем stemming, и нам нужно извлечь слово / фразу после stemming. То есть, если я ищу «апельсины», то через поиск «апельсин». Если я включу debugQuery, я смогу увидеть это, однако мы бы хотели получить к нему доступ, если это возможно. По сути, нам это нужно, поскольку мы передаем искомое слово в качестве параметра стороннему приложению, которое выделяет слово в онлайн-приложении для чтения PDF. В настоящее время, если пользователь ищет «апельсины», а документ содержит «оранжевый», тогда в PDF ничего не будет выделено, поскольку он пытается выделить «апельсины», а не «оранжевый».

Спасибо всем заранее,

Krt_Malta

1 Ответ

0 голосов
/ 03 июня 2011

У меня нет опыта работы с Solr, но если вам это нужно только для презентации пользователям, вы можете остановить их запросы, используя тот же самый стеммер, который использует Solr самостоятельно. Это, вероятно, будет быстрее, так как это позволит избежать поездки в индекс Солра. Для английского языка это предположительно будет http://tartarus.org/~martin/PorterStemmer/ - или вы можете проверить реализацию Solr.

Тем не менее, предостережение: большинство алгоритмов основ не гарантируют, что слова со стеблями будут фактическими словами. Проверьте здесь http://snowball.tartarus.org/algorithms/english/stemmer.html для примеров.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...