Учитывая ограниченный словарь терминов сущностей, я ищу способ извлечения сущностей с помощью интеллектуальных тегов с использованием Lucene. В настоящее время я могу использовать Lucene для:
- Поиск сложных фраз с нечеткостью
- Подсветка результатов
Однако я не знаю, как:
-Получить точные смещения совпавших фраз
-Создать аннотации для конкретного объекта за матч (не просто теги для каждого попадания)
Я пытался использовать метод объяснения () - но это дает только те термины в запросе, которые получили попадание, а не смещения попадания в исходном тексте.
Кто-нибудь сталкивался с подобной проблемой и готов поделиться потенциальным решением?
Заранее благодарю за помощь!