У меня есть приложение Django, размещенное на AWS Elastic Beanstalk.
Пользователи загружают документы на сайт. Иногда пользователи загружают документы, и сервер полностью выключается. Сервер мгновенно получает 500 с, отключается на 4 минуты, а затем волшебным образом приложение снова запускается и запускается.
Очевидно, что с приложением что-то происходит, когда оно перегружено.
Единственное, что я получаю от Elastic Beanstalk, это сообщение:
Environment health has transitioned from Ok to Severe. 100.0 % of the requests are failing with HTTP 5xx. ELB processes are not healthy on all instances. ELB health is failing or not available for all instances.
Затем, примерно через 4 минуты:
Environment health has transitioned from Severe to Ok.
У меня есть 1 экземпляр t2.medium EC2. Я настроил его как Балансировку нагрузки, но использую Минимум 1 Макс. 1, поэтому я не пользуюсь функциями балансировки нагрузки.
Вот скриншот моей вкладки здоровья:
Мое приложение отключилось 7/10, как видно на рисунке 1. В это время мой процессор заработал, но я не могу представить, что 20% ЦП было достаточно, чтобы перегружать мой сервер.
Как я могу определить, что может быть причиной этих коротких 500 ошибок? Где-нибудь еще я могу найти источник этого? Я не вижу ничего полезного в моем access_log или error_log. Я не знаю, с чего начать.