Для меня самая важная особенность Azure ML - это не беспокоиться о балансировке нагрузки, подобной этой. У нашей команды есть цель вычислений с max_nodes=100
для каждой функциональной ветки, и у нас есть Hyperdrive
конвейеров, которые приводят к 130 запускам для каждого конвейера.
Мы можем отправить несколько PipelineRun
s друг за другом и оркестратор выполняет тяжелую работу по организации очереди, отправке и всем запускам, чтобы PipelineRun
выполнялись в последовательном порядке, который я их отправил, и чтобы кластер никогда не перегружался. Это работает без проблем для нас в 99% случаев.
Если то, что вы ищете, это то, что вы хотите, чтобы PipelineRun
выполнялись параллельно, вам следует проверить ParallelRunStep
.
Другой вариант - изолировать ваши компьютеры. У вас может быть до 200 ComputeTarget
с на одно рабочее пространство. Стоимость двух 50 узлов ComputeTarget
равна стоимости одного 100 узлов ComputeTarget
.
В нашей команде мы используем pygit2
, чтобы создать ComputeTarget
для каждого feature, чтобы мы, как специалисты по обработке данных, могли быть уверены, что не наступаем на ноги нашим коллегам.