Почему в FasterRCNN размер короткого края 600, а максимальный размер 1000? - PullRequest
0 голосов
/ 31 января 2019

Я прочитал следующий код:

https://github.com/endernewton/tf-faster-rcnn/blob/a3279943cbe6b880be34b53329a4fe3f971c2c37/lib/model/config.py#L63

600 - размер пикселя самой короткой стороны изображения, а 1000 - максимальный размер пикселя самой длинной стороны масштабированного вводаобраз.Кто-нибудь может объяснить это?и как определить эти размеры?Должны ли мы изменить эти размеры?

1 Ответ

0 голосов
/ 01 февраля 2019

Они используются в функции prep_im_for_blob в здесь .Где target_size равно __C.TRAIN.SCALES = (600,), а max_size равно __C.TRAIN.MAX_SIZE = 1000.Он масштабирует изображение так, чтобы минимальный размер измененного изображения был равен __C.TRAIN.SCALES.Однако, если результирующее изображение становится больше, чем __C.TRAIN.MAX_SIZE, оно масштабируется так, что максимальный размер изображения с измененным размером равен __C.TRAIN.MAX_SIZE.Если входное изображение обычно находится в диапазоне 600 ~ 1000 пикселей, вам не нужно изменять эти значения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...