Lucene Entity Extraction - PullRequest
       14

Lucene Entity Extraction

4 голосов
/ 17 ноября 2010

Учитывая ограниченный словарь терминов сущностей, я ищу способ извлечения сущностей с помощью интеллектуальных тегов с использованием Lucene. В настоящее время я могу использовать Lucene для:
- Поиск сложных фраз с нечеткостью
- Подсветка результатов

Однако я не знаю, как:
-Получить точные смещения совпавших фраз
-Создать аннотации для конкретного объекта за матч (не просто теги для каждого попадания)

Я пытался использовать метод объяснения () - но это дает только те термины в запросе, которые получили попадание, а не смещения попадания в исходном тексте.

Кто-нибудь сталкивался с подобной проблемой и готов поделиться потенциальным решением?

Заранее благодарю за помощь!

1 Ответ

2 голосов
/ 17 ноября 2010

Смещение см. В следующем вопросе: Как получить смещение термина в Lucene?

Я не совсем понимаю ваш второй вопросДля меня это звучит так, будто вы хотите получить данные из сохраненного поля .Чтобы получить данные из сохраненного поля:

TopDocs results = searcher.Search(query, filter, num);
foreach (ScoreDoc result in results.scoreDocs)
{
    Document resultDoc = searcher.Doc(result.doc);
    string valOfField = resultDoc.Get("My Field");
}
...