разные размеры изображения (разрешение) в качестве входных данных для вывода на CNN - PullRequest
0 голосов
/ 27 июня 2019

Это может быть базовый концептуальный вопрос, но, читая различные CNN, такие как VGG, Alexnet, GoogleNet и т. Д., Кажется, что после того, как модель была обучена определенному размеру изображения в качестве входного (скажем, 256x256), я могу '• при выводе без изменения размера или обрезки дать модели другой размер изображения (1920 x 1080).Это правда?

Я знаю, что YOLO обрабатывает изображения с разным разрешением, изменяет ли Yolo размер изображения перед тем, как передать его слоям свертки?

Требование, которое у меня есть, - это распознавание объекта наДля серии изображений, которые могут иметь разный размер изображения, очевидным подходом будет изменение размера изображения, но это может привести к потере информации на изображении.

Если это так, нужно ли обучать модель длякаждый размер изображения, который у меня есть, а затем каждый раз перезагружать модель для этого конкретного изображения?

1 Ответ

1 голос
/ 28 июня 2019

Существуют более концептуальные проблемы: VGG, AlexNet, GoogleNet - это модели классификации изображений, а YOLO - модель обнаружения объектов.Только если сеть полностью сверточная, она может принимать изображения переменного размера.

Таким образом, единственным вариантом является изменение размера изображения до общего размера, это хорошо работает на практике, поэтому вы должны это сделать и оценить различные размеры изображения, чтобыПосмотрите, как точность меняется с ним.Только после такого эксперимента вы можете решить, не подходит ли изменение размера.

...