Не квадратное изображение как вход YOLOv3 - PullRequest
0 голосов
/ 12 марта 2019

Я пытаюсь обнаружить дорожные объекты (которые очень маленькие), используя yolov3.Для этого мой набор данных состоит из изображений размером 3840x400 пикселей.Реализация сети, которую я сейчас использую (реализация pytorch от ultralytics 1 ), принимает в качестве входных квадратов изображения.Если, например, я пропускаю через него изображение размером 3840x400 пикселей и устанавливаю img_size на 1000 пикселей, оно изменяет размер изображения до 1000x400 пикселей, а затем квадратирует его до 1000x1000 пикселей (помечая эти 600 оставшихся пикселей черными значениями, чтобыне меняйте высоту аспекта).Кажется, что большинство реализаций CNN работают с квадратами в качестве входных данных сетевой архитектуры.Мой вопрос: будет ли работать yolo, если я вручную изменю сетевую архитектуру на размер не в квадрате (например, 1000x400 px).Почему большинство CNN в искусстве работают с квадратными изображениями?

1 Ответ

0 голосов
/ 14 марта 2019

Если весь ваш набор данных состоит из прямоугольника, а не квадрата. например 3840x400.

Это лучший метод, чем использование квадратного ввода для построения архитектуры в качестве ввода с прямоугольником.

Причиной, по которой он использует квадратное изображение в большинстве CNN, является "квадратный ОБЩИЙ"

Иногда в области оценки позы человека в качестве входных данных они не используют квадратное изображение. Они используют прямоугольное изображение, например 192x256, потому что почти люди стоят в образах.

...