Я пытаюсь реплицировать пакетный API Azure в Kubernetes, у меня есть веб-интерфейс API, который работает как служба и, в свою очередь, использует API Kubernetes для динамического создания пакетных заданий.
Пока все хорошо.
Когда я отрываюсь, обычно каждая задача в этих заданиях довольно трудна для глубокого обучения TensorFlow, поэтому в идеале я бы хотел, чтобы Kubernetes планировал только один модуль на узел, а затем в сочетании с автоматическим масштабированием узла масштабировалдо моего кластера по мере необходимости.
В пакетном режиме Azure для каждого задания вы можете указать задачи для каждой виртуальной машины, аналогично пакетам на узел в Kubernetes.Кажется, что это не поддерживается в API Kubernetes и доступно только через конфигурацию kubelet max pods, которая не идеальна, так как она более жестко запрограммирована, чем хотелось бы.
Так что мой вопрос, есть ли способиспользование каких-то метрик в спецификации задания, чтобы вынудить Kubernetes ограничить количество экземпляров модуля на узел.В идеале это было бы упреждающее решение планировщика в том смысле, что он не планирует модуль только для того, чтобы понять, что позже он не получает ресурсов.