Мониторинг CloudWatch такой же, как вы обнаружили. Вы сможете сделать вывод, что один из ваших экземпляров заморожен, посмотрев на метрики, но CloudWatch не будет, например. например, отправлять вам электронные письма, когда ваше приложение не работает или работает слишком медленно.
Если вы ищете какое-то уведомление, когда ваше приложение или экземпляр не работает, я предлагаю вам использовать службу мониторинга. Pingdom - хороший вариант. Вы также можете настроить новый экземпляр в AWS и установить инструмент мониторинга, например Nagios , что будет моим предпочтительным вариантом.
Хорошие практики, которые всегда стоят того, на долгом пути: использование балансировки нагрузки ( Amazon ELB ), более одного экземпляра, на котором работает ваше приложение, Автоматическое масштабирование (когда экземпляр не работает, Amazon автоматически запускает новый и поддерживать ваш SLA), и пользовательский мониторинг.
Моя команда долгое время использовала собственный сценарий мониторинга, и мы всегда знали о сбоях, как только они возникали. По сути, если у нас было два узла, запускающих наше приложение, узел 1 отправлял HTTP-запросы на узел 2 и узел 2 на 1. Если какой-либо запрос принял больше, чем ожидалось, или вернул неожиданный статус HTTP или тело ответа, скрипт отправил электронное письмо системные администраторы. В настоящее время мы полагаемся на более надежные подходы, такие как Nagios, который может даже отслеживать компоненты операционной системы (потоки и т. Д.), Серверы приложений (состояние пулов соединений и т. Д.) И так далее. Это стоит каждого цента, вложенного в его установку.