Создание виджетов и аварийных сигналов CloudWatch для динамически меняющегося набора экземпляров EC2 - PullRequest
0 голосов
/ 03 апреля 2020

У нас есть инструментальная панель CloudWatch для мониторинга производственного стека. В настоящее время мы масштабируем и меняем экземпляры почти ежедневно. В настоящее время мы не используем автоматическое масштабирование (как слишком неясное / рискованное, пока загрузка не станет более понятной). Поэтому команда заново создает экземпляры вручную - что само по себе не является огромным усилием.

Однако каждый раз, когда это происходит, меняются соответствующие экземпляры, используемые в виджетах CW, что требует утомительного ручного обновления. Как пример c, у нас есть виджет Max CPU, который показывает отдельные загрузки CPU на экземплярах EC2 (около 30). Мы хотим показать каждую загрузку отдельной строкой, но на общем графике.

Экземпляры помечены стеком, тегами среды, поэтому их легко отфильтровать с помощью «Группы ресурсов», и вы можете использовать автоматически созданную панель мониторинга, чтобы приблизиться к необходимому виджету: https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Automatic_Dashboards_Resource_Group.html

Однако, поскольку у нас есть настраиваемая панель инструментов, для этого все равно требуется добавить все эти автоматически созданные виджеты и отфильтровать / исправить детали.

Кажется, что нет способа построить CW виджет, который выбирает метрики (в данном случае экземпляры) на основе критериев поиска, которые автоматически обновляются?

Во второй связанной топике c также кажется, что вы не можете использовать определенный виджет для создания базы для тревоги? Итак, опять же, вы должны вручную создавать тревоги для каждого экземпляра с нуля, даже если у вас есть график, к которому вы просто хотите применить пороговое значение?

Примечание: я думаю, что это на topi c, так как Единственное жизнеспособное решение для обоих - использовать CLI, например: https://docs.aws.amazon.com/cli/latest/reference/ec2/describe-instances.html, чтобы получать и фильтровать экземпляры, а затем обновлять / создавать виджеты / сигналы тревоги по мере необходимости.

...