О больших незафиксированных сегментах на диск сообщает _segments API - PullRequest
0 голосов
/ 19 июня 2020

Мы используем ElasticSearch версии 6.3. У нас есть одна ситуация, когда API GET / myIndex / _segments сообщал о некоторых файлах большого размера, которые не были зафиксированы на диск (зафиксированное поле упомянутого API неверно, см. Прикрепленное изображение).

Другой аспект заключается в том, что у нас также есть в этих сегментах огромное количество обновленных файлов (мы знаем, что они обновляются, а не удаляются).

Сопутствующая документация: https://www.elastic.co/guide/en/elasticsearch/reference/6.8/indices-segments.html

зафиксировано, был ли сегмент синхронизирован на диске. Закрепленные сегменты переживут жесткую перезагрузку. Не нужно беспокоиться в случае ложного, данные из незафиксированных сегментов также сохраняются в журнале транзакций, чтобы Elasticsearch мог воспроизвести изменения при следующем запуске.

Мои вопросы:

1. Что может привести к тому, что эти сегменты не будут записаны на диск?

2. Как эта ситуация может повлиять, например, на производительность поиска?

После объединения количество удаляемых документов надо уменьшить, не так ли?

enter image description here

...