Проблема выделения Elasticsearch с фрагментатором - PullRequest
0 голосов
/ 04 декабря 2018

Я нахожу проблемы с тем, как Elasticsearch выделяет текст. Пример: 1. при использовании «объединенного» маркера, т. Е.

 "highlight": {
        "type" : "unified",
        "fields": {
            "*": {}
        } 

отображаются следующие результаты:

"highlight": {
                    "FILE_CONTENT": [
                        "follows: \n1)Test Clause\n1.1) test 29_May\nDummy values - \is - INR  \is - <em>standard</em>",
                        "<em>whitespace</em> \nStart Date is - 05/31/2018 \nhgdhdrgdffggggggggggggggggggggggggggggggggggggggggggggggjerklwagggggggggggggggggggggggggggggggggg"
                    ]

мы можемсм. Шарик и подшипник выделены вместе, но показаны как разные элементы массива подсветки.2. То же самое при использовании подсветки "fvh" решает проблему:

"highlight": {
        "type" : "fvh",

        "fields": {
            "*": {}
        }
    }

Подсветка для этого:

 "highlight": {
                    "FILE_CONTENT": [
                        "Currency is - INR  \is - <em>standard whitespace</em> \nStart Date is - 05/31/2018 \nhgdhdrgdffgggg"
                    ]
                }

Для некоторых проблем со скоростью я не могу использовать подсветку Fvh.Я ограничен в использовании унифицированного маркера. В соответствии с справочным модулем Elasticsearch «фрагментатор»: «span» должен решить эту проблему.Но я получаю ту же проблему, что и при использовании «фрагментатор»: «span».

"highlight": {
        "type" : "unified",
        "fragmenter": "span",
        "fields": {
            "*": {}
        }
    }

Результаты:

"highlight": {
 "FILE_CONTENT": [
                        "follows: \n1)Test Clause\n1.1) test 29_May\nDummy values - \nCurrency is - INR  \is - <em>standard</em>",
                        "<em>whitespace</em> \nStart Date is - 05/31/2018 \nhgdhdrgdffggggggggggggggggggggggggggggggggggggggggggggggjerklwagggggggggggggggggggggggggggggggggg"
                    ] 
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...