количество индексов для 2 узлов кластера - PullRequest
0 голосов
/ 28 сентября 2019

Здравствуйте, я новичок в мире упругости и пытаюсь найти лучший подход для моего сценария.Я много читал о том, сколько осколков вам нужно или каково максимальное количество осколков и т. Д., Но я не совсем уверен, как применять все прочитанное.

Сейчас я должен проиндексировать 600 ГБ документов, на кластере из 2 узлов каждый будет иметь 32 ГБ ОЗУ и двухъядерный процессор.Я пытаюсь выяснить, каков наилучший подход для создания индексов и сколько шардов создать для каждого индекса.Эти документы являются счетами или другими документами, которые специально для месяца, года и компании.Это количество документов будет увеличиваться в будущем.Я подумал о следующем сценарии, в котором я буду создавать и индексировать, как это: company_documentType_year с 2 основными сегментами и 1 репликой.Проблема в том, что количество компаний превышает 250-300, количество типов документов может быть более 5 для каждой компании.Некоторые компании имеют мало документов, другие много документов.Эти документы предназначены не только для хранения, но и в будущем будут часто запрашиваться.

Мой вопрос таков: является ли хорошим подходом создание индекса для каждого типа документа для каждой компании на каждый год (companyA_invoices_2019)или я должен создать индекс с типом документа year (invoices_2019) и сохранить все связанные документы из всех компаний в этом индексе?Как эти 2 подхода влияют на эффективность поиска?

...