Сколько времени потребуется для обучения модели (трансферного обучения) на основе InceptionV3 с 3 миллионами изображений на установке с несколькими GPU? - PullRequest
0 голосов
/ 27 мая 2019

Я тренирую модель для классификации изображений, я использую Keras с бэкэндом тензорного потока на экземпляре AWS p2 с 8 графическими процессорами. Я настроил обучение в multi_gpu модели. Ниже приведены мои параметры.

- batch_size 256
- epoch 30
- steps_per_epoch 10000

Мой набор обучающих данных составляет 3 миллиона изображений. В идеале, сколько времени потребуется для этой установки, чтобы обучить модель. И я хотел бы получить некоторые отзывы или отзывы, которые сталкивались с подобными ситуациями.

В настоящее время одна эпоха занимает около 28 часов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...