Обучение нейронной сети в процессоре Google Colab - вторая эпоха не начинается - PullRequest
0 голосов
/ 19 июня 2020

Я обучаю нейронную сеть на процессоре Google Colab (я не могу использовать графический процессор из-за другой проблемы: FileNotFoundError: нет такого файла: -> Ошибка возникает только на GPU, а не на CPU ) с помощью fit_generator метод.

model.fit_generator(generator=training_generator,
                    validation_data=validation_generator,
                    steps_per_epoch = num_train_samples // 128,
                    validation_steps = num_val_samples // 128,
                    epochs = 10,
                    use_multiprocessing=True,
                    workers=6)

Кажется, что обучение для первой эпохи проходит нормально, но вторая не начинается. Ноутбук не ломается или итерации не останавливаются. Однако вторая эпоха не начинается ...

Что-то не так с моим кодом?

1 Ответ

2 голосов
/ 19 июня 2020

Привет

Эпоха очень медленная, потому что кажется, что вычисляются потери проверки и прочее. Это обычное дело. Вы можете видеть только прогресс обучения, но не прогресс проверки, если вы не создадите для этого специальный обратный вызов.

Проблема с вашим fit_generator в том, что вы, кажется, не поняли, как использовать steps_per_epoch и validation_steps. Если ваши данные проверки и обучения не имеют одинаковый размер (количество изображений), они не могут иметь одинаковое количество шагов (я имею в виду, что они «могут», но вы знаете, что я имею в виду)

Я действительно рекомендую вам использовать графический процессор для таких данных , так как он слишком долго загружает процессор. Попробуйте отладить свой код, потому что GPU того стоит.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...