документы reinsex излечения упорядочены, уменьшают свободное пространство - PullRequest
2 голосов
/ 28 октября 2019

шагов: --asticsearch 2.3 - создавать документы в ES => используется ~ 1 ГБ диска - обновлять те же документы в ES => используется ~ 2 ГБ диска

Почему это происходит? Это из-за версий? Можно ли избежать удвоения использования диска?

В настоящее время мы используем forcemerge (https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-forcemerge.html), но это занимает несколько часов.

1 Ответ

4 голосов
/ 28 октября 2019

При индексации документа в ES, который уже существует, ES помечает предыдущий документ как удаленный (но не сразу удаляет его из индекса) и индексирует новый документ.

Эффективно, еслиВаш документ весит 1 КБ. После переиндексации новой версии документа пространство, занимаемое первым документом, не будет немедленно восстановлено. Итак, первая «версия» документа занимает 1 КБ, а вторая «версия» документа - 1 КБ. Единственный способ удалить удаленные документы - вызвать API Force Merge, как вы обнаружили, или подождать, пока сегменты будут объединены автоматически. Вам не нужно беспокоиться об этом процессе.

...