Получить список терминов, которые были выделены Solr - PullRequest
3 голосов
/ 20 февраля 2012

Когда я ищу слово «рыба», я получаю список документов, содержащих это слово и варианты этого слова.Если я включу выделение, я могу увидеть фрагмент, который выглядит следующим образом: Закон требует, чтобы кто-либо <em> ловил </em> в общественных озерах ...

Я хотел бы показать пользователю приведенный выше фрагмент,кстати, это прекрасно работает, но я также хотел бы показать пользователю полный список слов, которые также были бы выделены, если бы я показал все фрагменты.

Например, я хотел бы показатьпользователь следующее:

Раздел 18.32A - Охота и рыболовство ... Закон требует, чтобы кто-либо <em> ловил рыбу </em> в общественных озерах ..Документ также содержит: Рыба, Рыбалка, Рыбак

Есть ли у вас способ получить этот список слов, кроме как с помощью solr, выделить весь документ, а затем проанализировать документ в поисках тегов emи составление списка выделенных слов?

1 Ответ

1 голос
/ 23 октября 2013

Я бы исследовал размер фрагмента (hl.fragsize), синонимы (synonym.txt) или основы (может помочь с вариациями слова), чтобы найти решение. Вы можете установить рыбу, рыбалку, ловить, чтобы все означало одно и то же в синонимах. Убедитесь, что вы понимаете, как работает расширение, и хотите ли вы, чтобы поиск заменял один другим. Также убедитесь, что вы знаете, нужно ли индексировать файл синонимов или выполнить запрос к нему. Не используйте синонимы как во время индекса, так и во время запроса. Существует также переключатель для включения нескольких совпадений при выделении.

...