Google-подобный Fragmenter для Solr? - PullRequest
3 голосов
/ 12 мая 2011

Я реализую приложение Solr, которое изначально использовало KinoSearch.

У меня все теперь перенесено в Solr и на страницу результатов, но я замечаю разницу в результатах. В частности, выделение не совсем то же самое.

В KinoSearch есть объект KinoSearch :: Highlight :: Highlighter, который, по-видимому, создает фрагменты, похожие на Google (пытается разбить предложения и добавляет elipsis (...) через пробел, если разрыв в середине предложения).

Есть ли у кого-нибудь предложения по реализации чего-то похожего с Solr. Я попытался использовать фрагментатор регулярного выражения в предложениях, но, похоже, он на самом деле применяет регулярное выражение в обратном порядке и начинает фрагменты с точки из предыдущего предложения.

Я могу добавить логику elipsis в коде представления. Мне просто интересно, сталкивался ли кто-нибудь с чем-то подобным и как с этим справились.

Спасибо!

1 Ответ

1 голос
/ 12 мая 2011

Мой вопрос состоял из двух частей. Первая проблема, касающаяся поиска, похоже, не соответствует регулярному выражению и ставит точку перед тем, как все решается здесь: http://lucene.472066.n3.nabble.com/Basic-sentence-parsing-with-the-regex-highlighter-fragmenter-td505749.html

Второй выпуск elipsis я собираюсь реализовать в коде переднего плана.

Я оставлю этот вопрос открытым, так как мне все еще интересно, существует ли лучшее решение.

...