У меня есть следующее расширение синонимов:
suco => suco, refresco, bebida de soja
Я хочу, чтобы токен поиска был таким:
Поиск "suco de laranja" был бы токенизирован на ["suco"," laranja "," refresco "," bebida de soja "].
Но я получаю его токены для [" suco "," laranja "," refresco "," bebida "," soja ""].
Учтите, что слово" de"является стоп-словом.И я хочу, чтобы это игнорировалось в запросе, как «bebida de laranja» становится [«bebida», «laranja»].Но я не хочу, чтобы это учитывалось в токенизации синонимов, поэтому «bebida de soja» по-прежнему остается одним токеном «bebida de soja».
мои настройки:
{
"settings":{
"analysis":{
"filter":{
"synonym_br":{
"type":"synonym",
"synonyms":[
"suco => suco, refresco, bebida de soja"
]
},
"brazilian_stop":{
"type":"stop",
"stopwords":"_brazilian_"
}
},
"analyzer":{
"synonyms":{
"filter":[
"synonym_br",
"lowercase",
"brazilian_stop",
"asciifolding"
],
"type":"custom",
"tokenizer":"standard"
}
}
}
}
}