Я нахожу проблемы с тем, как Elasticsearch выделяет текст. Пример: 1. при использовании «объединенного» маркера, т. Е.
"highlight": {
"type" : "unified",
"fields": {
"*": {}
}
отображаются следующие результаты:
"highlight": {
"FILE_CONTENT": [
"follows: \n1)Test Clause\n1.1) test 29_May\nDummy values - \is - INR \is - <em>standard</em>",
"<em>whitespace</em> \nStart Date is - 05/31/2018 \nhgdhdrgdffggggggggggggggggggggggggggggggggggggggggggggggjerklwagggggggggggggggggggggggggggggggggg"
]
мы можемсм. Шарик и подшипник выделены вместе, но показаны как разные элементы массива подсветки.2. То же самое при использовании подсветки "fvh" решает проблему:
"highlight": {
"type" : "fvh",
"fields": {
"*": {}
}
}
Подсветка для этого:
"highlight": {
"FILE_CONTENT": [
"Currency is - INR \is - <em>standard whitespace</em> \nStart Date is - 05/31/2018 \nhgdhdrgdffgggg"
]
}
Для некоторых проблем со скоростью я не могу использовать подсветку Fvh.Я ограничен в использовании унифицированного маркера. В соответствии с справочным модулем Elasticsearch «фрагментатор»: «span» должен решить эту проблему.Но я получаю ту же проблему, что и при использовании «фрагментатор»: «span».
"highlight": {
"type" : "unified",
"fragmenter": "span",
"fields": {
"*": {}
}
}
Результаты:
"highlight": {
"FILE_CONTENT": [
"follows: \n1)Test Clause\n1.1) test 29_May\nDummy values - \nCurrency is - INR \is - <em>standard</em>",
"<em>whitespace</em> \nStart Date is - 05/31/2018 \nhgdhdrgdffggggggggggggggggggggggggggggggggggggggggggggggjerklwagggggggggggggggggggggggggggggggggg"
]
}