Мой серверasticsearch получает значительный всплеск ЦП каждый день, когда десятки, если не сотни тысяч записей переносятся в bulk
запросах (обычно 500-1000 записей на запрос).Процессор в основном блокируется на 100%, ES перестает отвечать на запросы и в конечном итоге умирает.
sudo service elasticsearch status
● elasticsearch.service - Elasticsearch
Loaded: loaded (/usr/lib/systemd/system/elasticsearch.service; enabled; vendor preset: enabled)
Active: failed (Result: exit-code) since Tue 2018-05-29 08:06:38 UTC; 23min ago
Docs: http://www.elastic.co
Process: 2437 ExecStart=/usr/share/elasticsearch/bin/elasticsearch -p ${PID_DIR}/elasticsearch.pid --quiet -Edefault.path.logs=${LOG
Process: 2433 ExecStartPre=/usr/share/elasticsearch/bin/elasticsearch-systemd-pre-exec (code=exited, status=0/SUCCESS)
Main PID: 2437 (code=exited, status=127)
May 29 08:06:38 elastic1 systemd[1]: elasticsearch.service: Main process exited, code=exited, status=127/n/a
May 29 08:06:38 elastic1 systemd[1]: elasticsearch.service: Unit entered failed state.
May 29 08:06:38 elastic1 systemd[1]: elasticsearch.service: Failed with result 'exit-code'.
Warning: Journal has been rotated since unit was started. Log output is incomplete or unavailable.
Вот обзор некоторых индексов:
Некоторые из них - это окруженныеобновляются в течение этого времени, и все они имеют пропорционально большое количество docs.deleted
, что может быть как-то связано с этим ...?
ES 5.3.2, тип отдельного экземпляра EC2 t2.small, одноядерный, 2 ГБ ОЗУ + 2 ГБ, своп, 30 ГБ SSD.
Может ли кто-нибудь что-нибудь предложить для отладки / исправления высокой загрузки ЦПнагрузить?Надеемся, что можно что-то сделать, кроме увеличения размера экземпляра EC2.
Ограничение пропускной способности этих массовых запросов может быть тем, что я могу попробовать, но, опять же, надеюсь, это можно исправить без этого.
Возможно, два шарда на индексы этих размеров слишком велики?
Я попытаюсь обеспечить вывод _nodes/hot_threads
во время следующего всплеска.
РЕДАКТИРОВАТЬ 1: Вот CloudWatchмониторинг в течение 12 часов.Обычно загрузка ЦП значительно ниже 50% даже при скачках во время массовых обновлений, загруженных часов поиска и т. Д. Нормальное использование ближе к 5%.