Я нахожусь в стадии развертывания модели глубокого обучения с использованием Kubernetes.У меня следующие вопросы:
1: поддерживает ли kubernetes параллельную обработку?После предварительной обработки данных необходимо запустить модель глубокого обучения с различным набором гиперпараметров.Можно ли запустить его параллельно на разных модулях и для чего нужен код python ??
Если какой-либо модуль выходит из строя или выходит из строя во время работы, он позволит автоматически запускать другой модуль (копию исходного модуля)?
Кроме того, если конкретный модульдостигает определенного процента от GPU (порога), это заставит другой модуль работать автоматически ?.
Мне нужна ваша помощь по этому вопросу.Я нахожу много учебника по этому вопросу.Кроме того, ищите код Python для выполнения всех этих действий.
Спасибо