Как использовать стандартный анализатор Elasticsearch без строчных букв - PullRequest
0 голосов
/ 21 сентября 2018

Я пытаюсь создать анализатор вasticsearch, используя предустановки «стандартного» анализатора, но с одним изменением - без нижнего регистра слов.

Я попытался объединить пробел и стандартный анализатор следующим образом:

PUT /standard_uppercase
{
"settings": {
"analysis": {
  "analyzer": {
    "rebuilt_standard": {
      "tokenizer": "standard",
      "filter": [
        "standard",
        "whitespace"       
      ]
    }
  }
}
}
}

Но это не дает требуемых результатов.Есть ли способ перезаписать только строчную часть анализатора, но продать все существующие функции стандартного анализатора в розницу?

Заранее спасибо.

1 Ответ

0 голосов
/ 21 сентября 2018

Согласно документации

Определение

Стандартный анализатор состоит из:

Tokenizer

    Standard Tokenizer 

Token Filters

    Standard Token Filter
    Lower Case Token Filter
    Stop Token Filter (disabled by default)

Итак, вы можете достичь своих целей следующим образом:

PUT /standard_uppercase
{
  "settings": {
    "analysis": {
      "analyzer": {
        "rebuilt_standard": {
          "tokenizer": "standard",
          "filter": [
            "standard"   
          ]
        }
      }
    }
  }
}
...