Может кто-нибудь объяснить мне, как работает фильтр токенов синонимов, если синоним - это выражение из нескольких слов, а токенайзер - это пробел? Например, если у меня есть это простое отображение
PUT /test_index
{
"settings": {
"index" : {
"analysis" : {
"analyzer" : {
"synonym" : {
"tokenizer" : "whitespace",
"filter" : ["synonym"]
}
},
"filter" : {
"synonym_graph" : {
"type" : "synonym",
"lenient": true,
"synonyms" : ["multi word, bar => baz"]
}
}
}
}
}
}
Я не понимаю, как можно оценить термин мультислово , если токенайзер пробельных символов разбивает его на два слова мульти и слово. Поэтому, насколько я понимаю, фильтр синонимов никогда не получает " multi word " как один термин для поиска синонимов в конфигурации. Любая помощь приветствуется.