Мы используем Nagios для мониторинга нашей сети с отличными результатами. Теперь мы сталкиваемся с новым требованием:
Мы хотим уведомить Нагиоса о
фатальные, но критические ошибки приложения.
приложение не перестает работать, но
есть какая-то проблема, которая
нуждается в изучении.
Как только проблема будет рассмотрена,
нам нужен какой-то способ "разблокировать"
проблема в Nagios.
Мы попытались использовать системный журнал, но самая большая проблема заключалась в том, что после регистрации ошибки служба была переведена в состояние ошибки без возможности восстановления. Кроме того, хотя приложения и сообщают о критической ошибке в системный журнал, в большинстве случаев они не сообщают об ошибке «Все ясно».