Мы используем ElasticSearch версии 6.3. У нас есть одна ситуация, когда API GET / myIndex / _segments сообщал о некоторых файлах большого размера, которые не были зафиксированы на диск (зафиксированное поле упомянутого API неверно, см. Прикрепленное изображение).
Другой аспект заключается в том, что у нас также есть в этих сегментах огромное количество обновленных файлов (мы знаем, что они обновляются, а не удаляются).
Сопутствующая документация: https://www.elastic.co/guide/en/elasticsearch/reference/6.8/indices-segments.html
зафиксировано, был ли сегмент синхронизирован на диске. Закрепленные сегменты переживут жесткую перезагрузку. Не нужно беспокоиться в случае ложного, данные из незафиксированных сегментов также сохраняются в журнале транзакций, чтобы Elasticsearch мог воспроизвести изменения при следующем запуске.
Мои вопросы:
1. Что может привести к тому, что эти сегменты не будут записаны на диск?
2. Как эта ситуация может повлиять, например, на производительность поиска?
После объединения количество удаляемых документов надо уменьшить, не так ли?