Я тренирую модель для классификации изображений, я использую Keras с бэкэндом тензорного потока на экземпляре AWS p2 с 8 графическими процессорами. Я настроил обучение в multi_gpu
модели. Ниже приведены мои параметры.
- batch_size 256
- epoch 30
- steps_per_epoch 10000
Мой набор обучающих данных составляет 3 миллиона изображений. В идеале, сколько времени потребуется для этой установки, чтобы обучить модель. И я хотел бы получить некоторые отзывы или отзывы, которые сталкивались с подобными ситуациями.
В настоящее время одна эпоха занимает около 28 часов.