ElasticSearch преобразование текста в нижний регистр - PullRequest
0 голосов
/ 07 марта 2019

Я не указал анализатор, и у меня есть поле с гексом.Строка, в которой все присутствующие буквы преобразуются в нижний регистр.

Как мне это остановить (какой анализатор / токен-фильтр следует использовать)?

1 Ответ

0 голосов
/ 07 марта 2019

Если анализатор не указан, то применяются стандартный анализатор по умолчанию и анализатор ключевых слов, они выполняют следующее:

Стандартный анализатор

Стандартный анализатор делит текст на термины по границам слов, как это определено алгоритмом Unicode Text Segmentation.Он удаляет большинство знаков препинания, строчных терминов и поддерживает удаление стоп-слов.

Анализатор ключевых слов

Анализатор ключевых слов - это анализатор «noop», который принимает любой заданный тексти выводит точно такой же текст, что и один термин.

https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-analyzers.html

Чтобы получить доступ к анализатору ключевых слов no-op (no operation), в котором сохранен регистр, добавьте .keyword вконец имени поля примерно так:

{
  "query": {
    "term" : { 
      "hex_value.keyword" : "#00FF00" 
    } 
  }
}

Это позволит выполнить поиск с учетом регистра.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...