Apache Lucene: как получить первую подходящую подстроку из документа - PullRequest
0 голосов
/ 20 октября 2010

Я не смог найти в сети и в стеке информации какую-либо информацию о том, как получить первую соответствующую последовательность символов из документа Lucene.

Банкомат. Я использую эту логику для получения результатов из Lucene:

        Document doc=searcher.doc(hit.doc);
        String text=doc.get("text");
        if (text.length() > 80){
            text=text.substring(0,80);
        }
        results.add(new SearchResult(doc.get("url"), doc.get("title"), text));

Как вы можете видеть, это просто берет первые 80 символов искомого текста и объединяет его вместе с некоторыми другими данными в объект SearchResult.

Возможно ли каким-либо образом получить первую или даже самую высокую последовательность последовательности текста, которая фактически содержит какие-либо поисковые термины?

Ответы [ 2 ]

2 голосов
/ 20 октября 2010

Вам нужно Lucene Highlighter . Здесь и здесь Вы можете найти больше информации об этом.

1 голос
/ 20 октября 2010

Называется Хайлайтер . Вероятно, это дубликат другого вопроса выделения

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...