Я использую Tensorflow и замечаю, что отдельные шаги медленнее с несколькими узлами, чем с одним, поэтому я немного смущен тем, что представляет собой шаг на нескольких обучающих узлах в Sagemaker.
Если мойразмер пакета равен 10, и у меня есть 5 обучающих узлов, это «шаг» 2 для каждого узла или 10 для каждого узла?
Что если у меня размер пакета в 1 и 5 узлов?
Примечание - «узел» здесь представляет собой отдельный обучающий экземпляр, количество созданных из train_instance_count=5