GPU-util равен 0 при обучении mobilenet_v1 с использованием нескольких графических процессоров в тензорном потоке slim. - PullRequest
0 голосов
/ 03 января 2019

У меня 8 gpus, и я хотел бы обучить mobilenet_v1 с использованием ImageNet, и я последовал примеру в https://github.com/tensorflow/models/tree/master/research/slim/nets/mobilenet

Эта ссылка для mobilenet_v2.Так я изменил некоторые параметры и использую команду

python3 train_image_classifier.py --model_name="mobilenet_v1" --learning_rate=0.36 --label_smoothing=0.1 --moving_average_decay=0.9999 --batch_size=96 --num_clones=8 --learning_rate_decay_factor=0.98 --num_epochs_per_decay=0.3125 --dataset_dir="/tmp/dataset_dir/train/" --train_dir="/tmp/ckpt/"

Однако, когда я проверял свои утилиты GPU, я обнаружил, что не все мои GPU заняты.enter image description here

Как я могу заставить его тренироваться на всех 8 GPU?Какие параметры мне нужно изменить?Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...