Я прочитал много постов, касающихся обучения или тонкой настройки предварительно обученной глубоко сверточной нейронной сети, такой как VGGNet / AlexNet, с различными размерами изображений.
Одним из предложений было не обрезать / изменять размер изображений ииспользуйте фактический размер изображений. Недостаток этого метода был описан следующим образом:
Реализация входных массивов произвольного размера с одинаковыми вычислительными ядрами может создать много проблем - например, на графическом процессоре вам нужно знать, какие резервировать большие буферы, и многое другое. слабо, сколько нужно развернуть ваши циклы и т. д. Это основная причина того, что Keras требует постоянных форм ввода, входные данные переменного размера слишком болезненны, чтобы с ними иметь дело. до определенного размера.
Я работаю над довольно сложным набором данных, который имеет очень маленькие изображения (38x38) и достаточно большие (664x563). Наряду с некоторыми примерами имеет разрешение (1388 x 299) и (886 x 148).
- Какой будет наилучший способ определить оптимальный размер изображений для обучения и тестирования для такого сложного набора данных.
- Рассматривая все недостатки обучения изображений с переменным размером (не изменяя размер / обрезку), если мы настраиваем VGGNet, влияет ли это на уже изученные надежные функции, которые обучаются на изображениях определенного размера?
Ищем мнения экспертов и рекомендации!