ElasticSearch: Объясните расхождение между суммой всех конечных точек API "_size" и "store.size_in_bytes" документа? - PullRequest
0 голосов
/ 10 апреля 2020

Я замечаю, что суммируя свойство _size всех моих документов ElasticSearch в индексе, я получаю значение около 180 GB, но если я go до конечной точки API _stats для По тому же индексу я получаю значение size_in_bytes для всех primaries, равное 100 GB.

Насколько я понимаю, свойство _size должно быть размером поля _source, а индекс в настоящее время хранит _source, поэтому оно должно быть не меньше суммы _size?

1 Ответ

1 голос
/ 11 апреля 2020

Размер _size хранит фактический размер исходного документа. При сохранении исходного кода в сохраненных полях Elasticsearch будет сжимать его (по умолчанию LZ4, если я правильно помню). Таким образом, я ожидаю, что он будет иметь меньший размер на диске, чем фактический размер. И если в источнике нет двоичных данных, степень сжатия также будет значительно выше.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...