Эффективное хранение неанализированных текстовых полей в Elasticsearch - PullRequest
0 голосов
/ 02 мая 2018

У нас есть индекс Elasticsearch с более чем 100 полями. Мы явно определяем только небольшое количество полей в нашем отображении индекса и включаем динамическое отображение для всего остального.

Ряд полей представляют собой фрагменты разметки размером до 100 КБ. Нам нужно только иметь возможность проверить их существование, поэтому анализировать их не нужно.

Какое наиболее эффективное отображение использовать в этом случае?

До сих пор мы рассматривали следующие настройки для этих полей (или применялись как значения по умолчанию для всех текстовых полей с использованием динамических шаблонов):

  • Сохранение поля type как "text", но установка параметра index_options на "docs" only
  • Изменение type на "keyword" и определение doc_values как false

Однако мы не уверены, какая стратегия лучше.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...