ваши удаленные документы по-прежнему являются частью индекса, поэтому они влияют на производительность поиска (но я не могу сказать вам, сильно ли это влияет).
В период слияния c Lucene " неохотно "объединять тяжелые сегменты, так как требует некоторого дискового пространства и генерирует много ввода-вывода.
Вы можете получить ценную информацию о своих сегментах благодаря API индексных сегментов
Если у вас есть сегменты, близкие к пределу в 5 ГБ, вполне вероятно, что они выиграли ' не может быть объединено до тех пор, пока они не будут в основном состоять из удаленных документов.
Вы можете принудительно выполнить слияние по своему индексу с помощью API принудительного слияния
Помните, что принудительное слияние может генерироваться некоторая нагрузка на кластер для огромных показателей. Существует возможность удалять только документы, что должно снизить нагрузку.
only_expunge_deletes (Необязательно, логическое значение) Если установлено значение true, удалять только сегменты, содержащие удаления документов. По умолчанию установлено значение false.
В Lucene документ не удаляется из сегмента; просто помечен как удаленный. Во время слияния создается новый сегмент, который не содержит этих удаленных документов.
С уважением