Я хочу построить систему мониторинга для серверов глубокого обучения с InfluxDB + telegraf + grafana.
Основные c измерения:
- Загрузка ЦП (%)
- Использование ОЗУ (%)
- Использование GPU, памяти
- Выше всех измерений на пользователя
Когда я искал, не было службы для сбора измерений для каждого пользователя сразу. Если нет, пожалуйста, поправьте меня!
Теперь у меня есть два варианта сбора измерений для каждого пользователя. 1) Напишите код для сбора измерений вместе с InfluxDB.
2) Напишите плагин телеграфа для сбора измерений для каждого пользователя.
Какой вариант рекомендуется, и можно ли использовать одновременный сбор данных (вариант 1) и телеграф? Или я должен собрать все измерения, включая общесистемные, через свой собственный код, если я выберу вариант 1? Я беспокоюсь о том, загружена ли отправка измерений через мой собственный код и телеграф вместе.