У меня есть команда, в которой многие участники имеют разрешение отправлять задачи Spark в YARN (управление ресурсами) из командной строки.Трудно отследить, кто использует, сколько ядер, кто использует, сколько памяти ... например, сейчас я ищу программное обеспечение, инфраструктуру или что-то, что могло бы помочь мне контролировать параметры, которые использовал каждый член.Это будет мост между клиентом и пряжей.Затем я мог использовать его для фильтрации команд отправки.
Я посмотрел на mlflow , и мне действительно нравится отслеживание MLFlow, но оно было разработано для процесса обучения ML.Интересно, есть ли альтернатива для моих целей?Или есть другое решение проблемы.
Спасибо!