Лучший способ справиться с перегрузкой предупреждений монитора и десенсибилизацией? - PullRequest
0 голосов
/ 18 февраля 2011

Мы находимся в процессе добавления мониторинга к различным серверам и процессам в нашей сети, и в настоящее время различные мониторы отправят по электронной почте моей группе разработчиков, если что-то не так - никаких платежей клиентов на веб-сайте в течение X минут, веб-сервисов, которыеподдержка процесса не отвечает, ежедневный автоматический FTP к поставщику не удалось, и т. д. Хотя некоторые из них носят информационный характер и должны быть решены в ближайшее время (например, завтра или понедельник хорошо), некоторые из них имеют решающее значение и являются результатом фактических отключений клиентовпоэтому их нужно восстанавливать как можно скорее.

Проблема в том, что существует так много электронных писем, что люди теряют чувствительность к ним и начинают игнорировать даже критические.Несмотря на то, что у нас есть конкретный человек, который меняется каждую неделю, я все же нахожу, что критические оповещения будут иногда оставаться невостребованными и без ответа в течение нескольких часов.

Что делают другие люди, чтобы лучше реагировать на эти типы мониторинга и оповещенияситуации?Должен ли я иметь приборную панель или сводную электронную почту, которая дает все от дня?Тогда как насчет критических вещей - лучше ли использовать групповую электронную почту?Мне любопытно посмотреть, что делают другие, чтобы убедиться, что все решается быстро, но нужно убедиться, что разработчики не перегружены бездействием.

1 Ответ

0 голосов
/ 19 февраля 2011

В RHQ (http://rhq -project.org / ) у нас есть демпфирующие события - это означает, что, например, электронное письмо отправляется только каждые 5 предупреждений и т. Д.

Также возможноиметь предупреждение отключить отправку и затем иметь второе так называемое предупреждение о восстановлении, которое (если ситуация с ошибками исчезнет) повторно разрешает отправку, если появляется следующая ситуация ошибки.

См. http://www.rhq -project.org / display / JOPR2 / Alerts для получения дополнительной информации.

...