Question

Я пытаюсь создать анализатор вasticsearch, используя предустановки «стандартного» анализатора, но с одним изменением - без нижнего регистра слов.

Я попытался объединить пробел и стандартный анализатор следующим образом:

PUT /standard_uppercase
{
"settings": {
"analysis": {
  "analyzer": {
    "rebuilt_standard": {
      "tokenizer": "standard",
      "filter": [
        "standard",
        "whitespace"       
      ]
    }
  }
}
}
}

Но это не дает требуемых результатов.Есть ли способ перезаписать только строчную часть анализатора, но продать все существующие функции стандартного анализатора в розницу?

Заранее спасибо.

Lupanoide · Answer 1 · 21 сентября 2018

Согласно документации

Определение

Стандартный анализатор состоит из:

Tokenizer
    Standard Tokenizer 
Token Filters
    Standard Token Filter
    Lower Case Token Filter
    Stop Token Filter (disabled by default)

Итак, вы можете достичь своих целей следующим образом:

PUT /standard_uppercase
{
  "settings": {
    "analysis": {
      "analyzer": {
        "rebuilt_standard": {
          "tokenizer": "standard",
          "filter": [
            "standard"   
          ]
        }
      }
    }
  }
}

Как использовать стандартный анализатор Elasticsearch без строчных букв

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как использовать стандартный анализатор Elasticsearch без строчных букв

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы