В Lucene, какой подход рекомендуется использовать для поиска совпадений в результатах поиска?
В частности, предположим, что индексные документы имеют поле "fullText", в котором хранится текстовое содержимое некоторого документа. Кроме того, предположим, что для одного из этих документов содержание «Быстрая коричневая лиса перепрыгивает через ленивую собаку». Далее выполняется поиск по запросу "пес пес". Очевидно, документ станет хитом.
В этом сценарии можно ли использовать Lucene для предоставления чего-то вроде совпадающих областей для найденного документа? Поэтому для этого сценария я хотел бы создать что-то вроде:
[{match: "fox", startIndex: 10, length: 3},
{match: "dog", startIndex: 34, length: 3}]
Я подозреваю, что это может быть реализовано с помощью пакета org.apache.lucene.search.highlight. Хотя я не уверен в общем подходе ...