Поиск книг в Apache Solr - PullRequest
       14

Поиск книг в Apache Solr

0 голосов
/ 06 февраля 2012

Я очень новичок в Solr и оцениваю это. Моя задача - найти слова в корпусе книг и вернуть их в небольшом контексте . Пока я храню книги в базе данных, разбитой по параграфам (нарезаю книги по разрывам строк), я выполняю полнотекстовый поиск и возвращаю строку.

В Solr я должен был бы сделать то же самое, или я могу добавить всю книгу (в формате .txt) и, когда найдено совпадение, вернуть что-то вроде совпадения плюс 100 слов до и 100 слов после или что-то как это? Спасибо

1 Ответ

3 голосов
/ 06 февраля 2012

Подсветка сделает ваши ставки.http://wiki.apache.org/solr/HighlightingParameters

Вот соответствующие параметры для вас:

hl.snippets

The maximum number of highlighted snippets to generate per field.....

hl.fragsize

The size, in characters, of the snippets (aka fragments) created by the highlighter.....
The default value is "100". 

hl.mergeContiguous

Collapse contiguous fragments into a single fragment....

Для того, что вы описываете, установите для него возврат 5 (или того, что человек может разумно обработать) фрагментов из text поле с hl.fl;длина каждого фрагмента 400 символов (мое приближение 100 слов) вокруг слова / фразы.

См. Также hl.regex.slop для построения фрагментов вокруг фраз и hl.simple.pre/hl.simple.post для разметки.

...