Доброе утро, я сейчас работаю с кластером из 6 серверов. Каждый из них выполняет определенную задачу (HTTP, MySQL, MySQL mirror, Redis и AMQP среди других служб).
Падение одного из серверов или одной из служб приводит к тому, что система перестает работать;все серверы являются критическими. Идея состоит в том, чтобы восстановить все серверы, но пока это не произойдет, я хочу иметь представление о том, что происходит на каждом из серверов и служб.
Я хотел бы создать настраиваемый монитор состояния для серверов и служб. Доступ через интернет. Идея заключается в следующем:
- Доступ к серверу через SSH.
- Запустите сценарий, написанный на Python, и получите состояние CPU, RAM, жестких дисков и сети с помощью psutilбиблиотека.
- Выполните серию сценариев, написанных на Python, и получите статус служб, выполнив команды непосредственно на сервере, используя библиотеку команд.
Это будет сделано для каждогосервера и с интервалом в 3 секунды.
Правда в том, что я не знаю, есть ли лучший способ установить это, но это моя первая идея, и мне нужны другие мнения.
Знаете ли вы какой-нибудь более оптимальный способ выполнить эту задачу?
Спасибо!