У меня внезапно увеличилось число дисковых операций ввода-вывода в секунду на моих экземплярах EC2. На них все запущено веб-приложение Django 1.9.6. Приложения, установленные на нем - это Apache, Celery, New Relic Agent и сам Django Wsgi.
Приложение не выполняет никаких дисковых операций как таковых. Данные хранятся на RDS и Redis (Другой сервер). Статические файлы хранятся на S3 и подключены к облачному фронту. Поэтому я не могу определить причину такого высокого IOPS на диске.
То, что происходит, - это обычный запрос, который неожиданно требует вечности, чтобы ответить. При проверке cloudwatch и новой реликвии я вижу, что использование оперативной памяти возрастает. Тогда экземпляр не отвечает. Все запросы истекают и не могут войти по SSH. Когда я связался со службой поддержки AWS, они сказали, что VolumeQueueLength значительно увеличился, и как только он вышел из строя (через 15-20 минут), экземпляр работал нормально.
Есть идеи, в чем может быть проблема?