Нужен искомый текст и несколько строк вокруг него в поиске Solr в java API - PullRequest
0 голосов
/ 10 февраля 2020

Я использую Solr 7.7.2, и я написал программу Java в Solr, используя Solrj, который ищет слово в огромном текстовом файле. Я использую следующий код для отображения результатов поиска, представляющих весь текст.

SolrQuery params = new SolrQuery();
params.setQuery("content:word for search");

Как отобразить только одну строку текста, где слово находится в этой строке?

Весь код такой

1009 *

1 Ответ

0 голосов
/ 10 февраля 2020

Highlighting является одной из функций Solr. Для достижения выделения необходимо передать параметры запроса: -

hl - установить в значение true, это позволяет генерировать выделенные фрагменты в ответе на запрос.

hl.fl - упомянуть список полей для выделения. char * выделит все поля

hl.fragsize - Размер фрагментов (или фрагментов), созданных маркером, в символах. В исходном маркере «0» указывает, что следует использовать все значение поля без фрагментации. По умолчанию фрагмент имеет размер 100 символов

Проверьте, добавив следующий код.

params.setHighlight(true).setHighlightSnippets(1);
params.setParam("hl.fl", "*");
params.setParam("hl.fragsize", "0");

Вот полный код, который вы можете попробовать.

Примечание : Пожалуйста, игнорируйте жестко закодированные вещи из кода, такие как url ​​"solrUrl =" http://localhost: 8983 / solr"и строка" return "Success" ". из файла свойств и из постоянного файла. Ожидайте, что вы делаете то же самое. Никогда не используйте System out в вашем рабочем коде.

public String getResult() throws SolrServerException, IOException {

        final SolrClient client = getSolrClient();
        ModifiableSolrParams params = new ModifiableSolrParams ();


        params.set ("q", "comment_t:pizza");
        params.set ("fl", "id, comment_t");
        params.set ("sort", "id asc");
        params.set("hl", true);
        params.set("hl.q", "pizza");
        params.set("hl.simple.pre", "<strong>");
        params.set("hl.simple.post", "</strong>");
        params.set("hl.fl", "comment_t");
        params.set("hl.fragsize", "100");

        final QueryResponse response = client.query("demo", params);
        response.getHighlighting();

        final SolrDocumentList documents = response.getResults();

        System.out.println("Found " + documents.getNumFound() + " documents");
        for (SolrDocument document : documents) {
            final String id = (String) document.getFirstValue("id");
            final String name = (String) document.getFirstValue("comment_t");

            System.out.println("id: " + id + "; comment_t: " + name);

            if(response.getHighlighting() != null){
                System.out.println("highlighted text :: " + response.getHighlighting());
            }
        }
        return "Success";
    }



private SolrClient getSolrClient() {

        final String solrUrl = "http://localhost:8983/solr";
        return new HttpSolrClient.Builder(solrUrl).withConnectionTimeout(10000).withSocketTimeout(60000).build();
    }

Пожалуйста, найдите скриншот с выводом:

Highlighting output

...