Какое решение рекомендуется для мониторинга гетерогенной инфраструктуры? - PullRequest
0 голосов
/ 23 мая 2018

Я ищу инструмент мониторинга для следующих случаев использования:

  • Сбор основных показателей о виртуальной машине (использование процессора, использование памяти, ввод-вывод, доступное пространство)
  • Извлечение метрик из SQL Server (возможно, при выполнении некоторых запросов)
  • Извлечение информации из внешней службы об обработке, т. Е. Сколько обработки выполняется в настоящее время и как долго.Я думаю о написании скриптов на Python, но не знаю, как совмещать их с инструментом мониторинга
  • Имею возможность составлять графики и управлять оповещениями, и будет приятно иметь возможность отправлять не только письма, но и отправлять сообщения.для слабых / ms команд.

Я был в Prometheus, потому что он имеет wmi_exporter, node_exporter, sql exporter, менеджер предупреждений с возможностью отправлять уведомления нескольким адресатам, но я не знаю, что делатьделать с этим внешним сервисом и скриптами python.

Есть предложения?

1 Ответ

0 голосов
/ 24 мая 2018

Прометей определенно может сделать то, что, как вы говорите, вам нужно.Некоторые из них могут быть не тривиальными, но вы определенно можете заполнить пробелы самостоятельно.

Например, вы можете получить машинные метрики в основном из коробки, запустив node_exporter и очистив его от Прометея, но я неНе думаю, что он имеет, например, информацию обо всех запущенных процессах.Последний может потребовать от вас написать агента / экспортера: простой веб-сервер, который предоставляет метрики для /metrics;Существует клиентская библиотека Python , чтобы помочь с этим.Или же указанные процессы (при условии, что они являются вашим кодом) вместо этого выдвигают метрики на Pushgateway , если они являются краткосрочными пакетными заданиями.

О, и для диаграмм / панелей мониторинга вы, вероятно, захотите Графана , поскольку способности Прометея в этой области довольно ограничены, и Графана довольно хорошо интегрируется с Прометеем.

...