Я изучаю информатику и участвую в курсе компьютерного зрения, где в настоящее время я должен работать над проектом компьютерного зрения по моему выбору. Поэтому я выбираю прогнозирование заметности / прогнозирования фиксации взгляда как topi c и решаю повторно реализовать статью SalGAN: Визуальное прогнозирование заметности с генеративными состязательными сетями (статья: https://arxiv.org/abs/1701.01081).
Это не первый мой курс по машинному обучению и глубокому обучению, но я впервые внедряю сеть CNN и GAN. Я выбрал pytorch в качестве языка программирования.
До недавнего времени я думал, что моя реализация в порядке, но после обучения в течение 100 эпох я понял, что модель обучается очень-очень медленно. (например, потеря тренировки изменяется с 0,3478 до 0,3474 после одной эпохи). Так как это мой первый проект компьютерного зрения, я не уверен, нормально ли это, или это из-за ошибки в моем подсчете потерь, или это просто из-за очень низкой скорости обучения 0,0003 ...
Часто ли в CV такие низкие темпы обучения? Мне кажется, что даже если бы я тренировался в течение 300 эпох (что, я полагаю, заняло бы около 2 дней), модель не сильно улучшилась бы из-за этих небольших обновлений.
Вы можете взглянуть на мой код здесь: https://github.com/bigabig/saliency/blob/master/train.py