У нас есть кластер Kubernetes.
Теперь мы хотим расширить его с помощью узлов GPU (чтобы это были единственные узлы в кластере Kubernetes, которые имеют графические процессоры).
Мы бынравится избегать Kubernetes планировать pods на тех узлах, если они не требуют графических процессоров.
Не все наши конвейеры могут использовать графические процессоры.Абсолютное большинство по-прежнему только для процессора.
Серверы с графическими процессорами могут быть очень дорогими (например, Nvidia DGX может стоить до $ 150 / k на сервер).
Если мы просто добавим узлы DGX в кластер Kubernetes, то Kubernetesбудет также планировать рабочие нагрузки не-GPU, что будет пустой тратой ресурсов (например, другие задания, которые планируются позже и нуждаются в GPU, могут иметь там другие ресурсы не-GPU, такие как ЦП и память, поэтому им придетсядождитесь завершения заданий / контейнеров не-GPU).
Есть ли способ настроить планирование ресурсов GPU в Kubernetes так, чтобы он планировал пакеты только на этих дорогих узлах, если им требуются GPU?Если этого не произойдет, им, возможно, придется подождать, пока другие серверы, не использующие графические процессоры, будут иметь доступ к другим ресурсам, таким как процессор и память, на серверах без графического процессора ...
Спасибо.