Средство поиска ElasticSearch не дает слово root - PullRequest
0 голосов
/ 05 февраля 2020

Как мне заставить стеммера токенизировать «великий, великий, величайший» в его root слово? Я пытался использовать снежный ком, kterm, stemmer, но все, кажется, токенизируют слово как есть. Я ожидаю, что это будет "здорово".

Вот сопоставление для ElasticSearch 7.

{"book": {
  "mappings": {
    "properties": {
      "title":{
          "type":"text",
          "analyzer":"search_string_analyzer"
      }
    }
  },
  "settings":{
    "index":{
      "analysis":{
        "filter":{
          "eng_stemmer":{"type":"stemmer","language":"english"},
          "eng_stop":{"type":"stop","stopwords":["_english_"]},
          },

      "analyzer":{
        "search_string_analyzer":{
          "filter":["lowercase",
                  "eng_stop","asciifolding","eng_stemmer"],
                   "type":"custom","tokenizer":"standard"
        }
      }
    },
  }
}

1 Ответ

1 голос
/ 10 февраля 2020

Похоже, что ни один из стандартных стеммеров не делает это преобразование. Может быть, выбор может быть на заказ? https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-stemmer-override-tokenfilter.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...