глобальных шагов в секунду не увеличивается при использовании распределенного TensorFlow - PullRequest
0 голосов
/ 27 октября 2018

глобальных шагов в секунду значительно увеличивается при обновлении до более мощных ускорителей в нераспределенной среде, поэтому я не верю, что мы ограничены вводом-выводом.однако в наших распределенных настройках нет заметных различий в глобальных шагах в секунду, независимо от того, сколько рабочих / серверов параметров мы добавляем.мы используем Estimator API.

измеряет ли глобальное количество шагов в секунду среди рабочих или измеряет количество шагов в секунду для отдельного рабочего?

Я также вижу определенные значения шагов вжурналы, в которых есть несколько записей с разными потерями, например, потеря master-replica-0: x step: y потеря worker-replica-0: z step: y.

есть мысли?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...