Означает ли один шаг в API обнаружения объектов обработку одного изображения или одного ограничивающего прямоугольника? - PullRequest
0 голосов
/ 19 сентября 2019

В файле pipe.config в API обнаружения объектов Tensorflow у нас есть параметр NUM_STEPS.

Означает ли один шаг обработку одного целого изображения или одной ограничительной рамки?

В файле конфигурации у нас есть:

model {
  faster_rcnn {
    # (...)
  }

  train_config: {
    batch_size: 1
    optimizer {
      # (...)
    }
    gradient_clipping_by_norm: 10.0
    # (...)
    num_steps: 200000  # <-- HERE IT IS
    # (...)
  }
}

Например, у нас есть обучающий TFRecord с 2 картинками, по 10 коробок на каждой.Если для NUM_STEPS установлено значение 10, значит ли это, что я обработаю первые 10 ящиков или каждую фотографию 5 раз?

Полный файл конфигурации можно найти здесь:

https://github.com/tensorflow/models/blob/32dadfc2def4f05faeedacce98e4c4099be4c433/research/object_detection/samples/configs/faster_rcnn_inception_v2_coco.config#L113

1 Ответ

1 голос
/ 19 сентября 2019

Один «шаг» соответствует одной пакетной обработке.

Ввод более быстрого RCNN является полным изображением, а размер пакета равен 1, что означает, что вы используете одно изображение каждый раз.В вашем случае первый шаг будет обрабатывать пять полей первого изображения, а второй шаг - пять второго.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...