Это нормально!Вам не нужно беспокоиться о размере изображения.Вы можете комментировать свой набор данных с любыми размерами, когда вы начинаете тренировку, Yolo изменит размер тренировочного образа в соответствии с размером сети, например, 416x416, 608x608.
Также обратите внимание, что в исходное репо во время работы в сетиsize изменяется каждые 10 итераций, если вы установили random = 1
в вашем файле cfg.random = 1
означает, что Yolo изменяет размер сети для каждых 10 итераций, полезно повысить точность, обучая сеть с различным разрешением.
Согласно статье Yolo:
Однако,Поскольку наша модель использует только сверточный и объединяющий слои, ее можно изменить на лету.Мы хотим, чтобы YOLOv2 был устойчивым к работе с изображениями разных размеров, поэтому обучим этому в модели.Вместо того, чтобы фиксировать размер входного изображения, мы меняем сеть каждые несколько итераций.Каждые 10 пакетов наша сеть случайным образом выбирает новый размер изображения.Поскольку наша модель уменьшает выборку в 32 раза, мы получаем следующие кратные 32: {320, 352, ..., 608}.Таким образом, наименьший вариант - 320 × 320, а самый большой - 608 × 608. Мы изменяем размеры сети до этого измерения и продолжаем обучение.
Однако, если вы используете репозиторий AlexeyAB процесс изменения размера не будет сохранять соотношение сторон https://github.com/AlexeyAB/darknet/issues/232#issuecomment-336955485