Ложные срабатывания при более быстром обнаружении объектов - PullRequest
0 голосов
/ 02 января 2019

Я обучаю детектор объектов, используя тензор потока и модель faster_rcnn_inception_v2_coco, и испытываю много ложных срабатываний при классификации видео.

После некоторых исследований я понял, что мне нужно добавить негативные изображения в тренировочный процесс.

Как мне добавить их в tfrecord файлы? Я использовал код файла csv to tfrecord, указанный в руководстве здесь .

Также кажется, что ssd имеет hard_example_miner в конфигурации, что позволяет настроить это поведение, но это не относится к более быстрым rcnn? Есть ли способ добиться чего-то похожего на более быстром rcnn?

1 Ответ

0 голосов
/ 10 января 2019

Я столкнулся с той же проблемой с более быстрым RCNN, хотя вы не можете на самом деле использовать hard_example_miner с более быстрой моделью RCNN , вы можете добавить немного фоновые изображения , т.е.изображения без объектов (все остается прежним, за исключением того, что в xml нет тега объекта для этого конкретного изображения)

Еще одна вещь, которая действительно творила чудеса для меня, это использование imgaug библиотека , вы можете увеличивать изображения и ограничивающие рамки, используя тот же скрипт .Попробуйте увеличить данные обучения в 10 или 15 раз, и тогда я бы предложил вам снова тренироваться примерно до 150000-200000 шагов.

Эти два шага помогли мне эффективно сократить количество ложных срабатываний.

...