Фон
Наш код записан с:
- Модульные тесты
- Сквозные тесты
- Код обзор
- Процесс подготовки
- Процесс развертывания
Напротив, наши предупреждения просто записываются, а затем время от времени изменяются вручную. Нет качественного процесса вообще.
Этот процесс оправдан для простых проверок пороговых значений. Однако наши оповещения иногда строятся на сложных запросах. Иногда составленный из ~ 20 строк запроса.
Если мы случайно отключим оповещение, это может подвергнуть нас нестабильности работы, поскольку мы не будем знать, сломался ли какой-либо лог c или компонента.
Вопрос
Существует ли рекомендуемая методология проверки качества сложных оповещений?
PS
Мы используем оповещения Splunk