Как мне заставить стеммера токенизировать «великий, великий, величайший» в его root слово? Я пытался использовать снежный ком, kterm, stemmer, но все, кажется, токенизируют слово как есть. Я ожидаю, что это будет "здорово".
Вот сопоставление для ElasticSearch 7.
{"book": {
"mappings": {
"properties": {
"title":{
"type":"text",
"analyzer":"search_string_analyzer"
}
}
},
"settings":{
"index":{
"analysis":{
"filter":{
"eng_stemmer":{"type":"stemmer","language":"english"},
"eng_stop":{"type":"stop","stopwords":["_english_"]},
},
"analyzer":{
"search_string_analyzer":{
"filter":["lowercase",
"eng_stop","asciifolding","eng_stemmer"],
"type":"custom","tokenizer":"standard"
}
}
},
}
}