У нас есть 2 EC2, один «производство» и один «приемка».На этих EC2 у нас есть док-контейнер, работающий для воздушного потока.На производстве, каждый день данные обрабатываются, на приеме нет.Иногда EC2 «ломается»;мы больше не можем получить доступ к EC2 через Putty, он дает только черный экран.Более того, сервер также больше не работает: ежедневные процессы перестают работать.Мы думали, что это проблема памяти с данными на EC2, однако, теперь и EC2 приема не работал в выходные дни, в то время как никакие данные ежедневно не обрабатываются на сервере «принятия».
Если я смотрю на мониторинг EC2, я вижу, что процессор внезапно упал до 0% (обычно около 20% из-за докера / потока воздуха).Также сеть In / Out упала.Перезагрузка решила проблему.Однако мы не хотим, чтобы вещи могли сломаться в выходные дни.
У кого-нибудь есть идеи, почему это может произойти?Мы используем m4.xlarge.