Не похоже, что вы что-то упускаете.Они считают, что достаточно распечатать значение потери и сообщить сводки для одной башни.
Обычно вы отслеживаете потери / сводки для каждого графического процессора и / или вычисляете среднюю потерю только для отладки, когда начинаете использоватьновая модель на нескольких графических процессорах.После этого достаточно отслеживать только одну башню, поскольку каждая башня содержит одну и ту же копию модели.
Кстати, мне проще использовать tf.estimators
для обучения нескольких графических процессоров, используя tf.contrib.estimator.replicate_model_fn(...)
и tf.contrib.estimator.TowerOptimizer(...)
для распределения модели и оптимизатора.