глобальных шагов в секунду значительно увеличивается при обновлении до более мощных ускорителей в нераспределенной среде, поэтому я не верю, что мы ограничены вводом-выводом.однако в наших распределенных настройках нет заметных различий в глобальных шагах в секунду, независимо от того, сколько рабочих / серверов параметров мы добавляем.мы используем Estimator API.
измеряет ли глобальное количество шагов в секунду среди рабочих или измеряет количество шагов в секунду для отдельного рабочего?
Я также вижу определенные значения шагов вжурналы, в которых есть несколько записей с разными потерями, например, потеря master-replica-0: x step: y потеря worker-replica-0: z step: y.
есть мысли?