Если вы ищете что-то более легкое и простое, чем Nagios, см. AlertGrid . Его очень удобно использовать, единственным недостатком является то, что он требует некоторой интеграции: AlertGrid только LISTENS для сигналов сердцебиения, поэтому вы должны предоставлять их вручную (API очень прост).
Еще одна интересная вещь: если процесс, который вы хотите отслеживать, запускает ВАШ код - вы можете отправлять события пульса непосредственно "изнутри", и эти события могут содержать ваши собственные пользовательские параметры. Затем в AlertGrid - вы можете легко управлять пользовательскими правилами для этих параметров. Таким образом, если исполняемый файл, который вы отслеживаете, является, например, приложением обработки заказов, вы можете отправить параметр под названием «number_of_orders_processed» и создать правило «if number_of_orders_processed> 100, отправьте SMS-сообщение / позвоните по телефону ...», и он сразу же заработает.
Я в команде разработчиков AlertGrid, если у вас есть какие-либо вопросы - не стесняйтесь спрашивать.