Как определить оптимальный размер изображения для обучения / тонкой настройки глубоких нейронных сетей? - PullRequest
0 голосов
/ 17 октября 2019

Я прочитал много постов, касающихся обучения или тонкой настройки предварительно обученной глубоко сверточной нейронной сети, такой как VGGNet / AlexNet, с различными размерами изображений.

Одним из предложений было не обрезать / изменять размер изображений ииспользуйте фактический размер изображений. Недостаток этого метода был описан следующим образом:

Реализация входных массивов произвольного размера с одинаковыми вычислительными ядрами может создать много проблем - например, на графическом процессоре вам нужно знать, какие резервировать большие буферы, и многое другое. слабо, сколько нужно развернуть ваши циклы и т. д. Это основная причина того, что Keras требует постоянных форм ввода, входные данные переменного размера слишком болезненны, чтобы с ними иметь дело. до определенного размера.

Я работаю над довольно сложным набором данных, который имеет очень маленькие изображения (38x38) и достаточно большие (664x563). Наряду с некоторыми примерами имеет разрешение (1388 x 299) и (886 x 148).

  1. Какой будет наилучший способ определить оптимальный размер изображений для обучения и тестирования для такого сложного набора данных.
  2. Рассматривая все недостатки обучения изображений с переменным размером (не изменяя размер / обрезку), если мы настраиваем VGGNet, влияет ли это на уже изученные надежные функции, которые обучаются на изображениях определенного размера?

Ищем мнения экспертов и рекомендации!

...