Есть ли какой-нибудь инструмент для подсветки Lucene, который не требует исходного текста, а может работать с терминами и т. Д. - PullRequest
3 голосов
/ 24 сентября 2010

Я читал новое 2-е издание Lucene в действии, и они приводят пример выделения, но, к сожалению, он требует исходного текста, чтобы он мог получить положение терминов и т. Д. Маркер является официальным в contrib,так что это означает, что это спонсируемый или официальный маркер.

Кто-нибудь знает другой маркер, который не требует исходного текста, но работает с использованием термина позиций (извините, если я неправильно понял терминологию) ???

1 Ответ

0 голосов
/ 27 сентября 2010

Как стандартная подсветка, так и FastVectorHighlighter могут использовать индекс, если вы сохраняете термины.(Фактически, FVH может только использовать индекс).Вы можете увидеть пример этого на странице 274 Lucene в действии.Соответствующая строка кода:

TokenStream stream = TokenSources.getAnyTokenStream(searcher.getIndexReader(), sd.doc, "title", doc, analyzer);

, которая получит поток токенов из индекса.

...