Каково влияние неуникальных идентификаторов на индекс Elasticsearch? - PullRequest
4 голосов
/ 21 января 2020

Elasticsearch docs говорит:

При индексации документов, указывающих пользовательскую _routing, уникальность _id не гарантируется для всех сегментов в индексе. Фактически, документы с одинаковым _id могут оказаться в разных сегментах, если будут проиндексированы с разными значениями _routing.

Мы планируем ввести в наши документы настраиваемую маршрутизацию, но было бы очень удобно, если бы мы могли просто добавьте маршрутизацию в наш существующий индекс. Как и ожидалось, согласно документам, более новые версии документа будут в правильном сегменте, но старый раздел будет сохранять старые версии до тех пор, пока мы их не удалим.

Помимо потери дискового пространства, каковы возможные последствия неуникальных идентификаторов в индексе Elasticsearch, поскольку он доступен для нескольких основных сегментов?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...