Несколько недель назад менеджер нашего отдела облачного хостинга решил включить уведомления о переполнении для заданий ActiveBatch на всех наших производственных серверах.Это вызвало скачок громкости на 800% из-за уведомлений о переполнении, которые не были проблемными или действующими.У нас была встреча на этой неделе, и он в основном утверждал, что так и должно быть.Пока я был на связи на прошлой неделе, мне позвонили 28 человек (многие поздно ночью и рано утром).Только 2 инцидента были ошибками.Естественно, я разочарован и ищу решение.
Поэтому, вместо того чтобы использовать уведомления о переполнении для удовлетворения наших SLA и конкретных потребностей клиентов, я исследую ActiveBatch, чтобы понять, есть ли лучший способ.Многие из наших рабочих мест сильно различаются в зависимости от объема и времени месяца.Переполнения не эффективны, поскольку во многих случаях они возникают более чем за 10 часов до того, как запущенное задание вызовет проблему.
Я пытаюсь выяснить, могут ли задания ActiveBatch определять, выполняются ли другие задания ActiveBatch.на конкретном сервере.И мне также нужно знать, могут ли они прекратить выполнение других заданий ActiveBatch, запущенных на сервере, и затем выдать предупреждение.Ниже приведен пример, который демонстрирует, что я пытаюсь сделать, учитывая требования клиента на одном из наших серверов.
Требования
10 AM Задание пакетной оплаты должно быть выполнено до 2Пакетное задание PM PM Чтобы удовлетворить это требование, я хотел бы создать расписание задания, которое будет запущено в 13:30, чтобы сгенерировать уведомление, чтобы предупредить кого-то о том, что задание в 10:00 не завершено.Возможно ли это?
На сервере не должно выполняться заданий ActiveBatch, когда задание «Конец дня» начинается в 12:00. По аналогии со сценарием выше, я хочу настроить AB для созданияуведомление, если какие-либо работы выполняются в 23:30.Можно ли это сделать?
Задание конца дня должно быть завершено к 6 часам утра, когда синхронизация с хранилищем данных начинается снова. Просто нужно выдать предупреждение, если задание EOD все еще выполняется, когдавремя приближается к 6 утра SLA.
Система должна быть доступна к 8 часам утра. Для этого я думаю, что мы собираемся настроить AB для вызова веб-службы вприложение, так что задание не выполняется и генерирует уведомление в случае сбоя вызова.Это я уверен, что мы можем сделать.У нас есть клиент веб-службы, который может выполняться через командную строку как часть развертывания.
Я предлагаю гораздо более простой способ мониторинга сервера на наличие условий, которые требуют предупреждения.Кто-нибудь сталкивается с аналогичными проблемами в своей организации и есть какие-либо советы?Я ведущий Java-разработчик, и у меня нет прав администратора для ActiveBatch.Наш администратор требует, чтобы мы представили обоснование изменения пороговых значений превышения.Но я не согласен с его подходом.У большинства наших клиентов есть требования, аналогичные приведенному выше примеру.Таким образом, в нашем случае создание уведомлений в определенное время, если выполняются определенные задания, выглядит намного более чистым и элегантным подходом.Я пытаюсь исследовать возможности AB и понять, возможно ли то, что я предлагаю, прежде чем я изложу свое дело с нашим администратором и руководством.Администратор создает позу, как будто ему не нравится идея адаптировать способ создания уведомлений клиентом.Пожалуйста помоги.Я не могу взять еще одну неделю из трех десятков звонков в любое время дня и ночи.У нас есть ActiveBatch, интегрированный с PagerDuty, поэтому каждое уведомление, включая переполнения, генерирует инцидент PagerDuty для вызывающего абонента.