Связь между размером партии и глобальным счетчиком шагов в TensorFlow - PullRequest
0 голосов
/ 09 марта 2019

Я тренирую MobileNetV2 на TensorFlow, используя train_image_classifier.py.(https://github.com/tensorflow/models/blob/master/research/slim/train_image_classifier.py)

Модель: набор данных MobileNetV2: сервер ImageNet: ядра 64CPU и 8 графических процессоров NVIDIA

Он сообщает о таком прогрессе (для пакетного размера 2 и num_clones 4 на сервере с 4 графическими процессорами)).

ИНФОРМАЦИЯ: тензор потока: глобальный шаг 6760: потери = 7,1687 (0,316 сек / шаг)

ИНФО: тензор потока: глобальный шаг 6770: потери = 6,8133 (0,370 сек / шаг))

Попытка выяснить, что означает «шаг» - указывает ли он установленное количество обработанных изображений или зависит от указанного размера batch_size?

Я увеличилс размером партии до 8 и выдерживает num_clones в 4

ИНФО: тензор потока: глобальный шаг 6260: потери = 6,4882 (0,619 сек / шаг)

ИНФО: тензор потока: глобальный шаг 6270:потеря = 6,3866 (0,616 с / шаг)

...