Обучение Faster R-CNN с несколькими объектами в изображении - PullRequest
0 голосов
/ 27 августа 2018

Я хочу обучить сеть Faster R-CNN моими собственными изображениями для обнаружения лиц.Я проверил довольно много библиотек Github, но это пример учебного файла, который я всегда нахожу:

/data/imgs/img_001.jpg,837,346,981,456,cow
/data/imgs/img_002.jpg,215,312,279,391,cat

Но я не могу найти пример, как тренироваться с изображениями, содержащими пару объектов.Должно ли это быть:

1)  /data/imgs/img_001.jpg,837,346,981,456,cow,215,312,279,391,cow

или

2)  /data/imgs/img_001.jpg,837,346,981,456,cow
    /data/imgs/img_001.jpg,215,312,279,391,cow

?

1 Ответ

0 голосов
/ 27 августа 2018

Я просто не мог с собой поделать, но цитирую здесь FarCry3 : «Определение безумия - это делать одно и то же снова и снова и ожидать разных результатов».(Обратите внимание, что это чисто развлекательный контекст и не предназначено для того, чтобы оскорблять вас; я не нашел бы время ответить на ваш вопрос, если бы не счел это оправданным)

Во втором примере, вы бы вводили точно такие же входные данные , но требовали бы, чтобы сеть изучала два разных результата.Но, как вы уже заметили, многие библиотеки не очень часто поддерживают несколько меток на изображение.

Зачастую это делается просто ради простоты, поскольку требует изменения метрик., чтобы приспособить для нескольких выходов: вместо того, чтобы иметь горячие закодированные цели, теперь у вас может быть несколько «целей».

Это еще более сложно в задаче обнаружения объекта (а не классификации объекта, как описанодо), так как теперь вы должны решить, как вы представляете свои цели.Если это вообще возможно, я бы лично ограничился маркировкой одного класса на изображение или взглянул на другую библиотеку изображений, которая это поддерживает, поскольку усилия по переписыванию такого большого количества кода, вероятно, не стоят мелкого улучшения результатов..

...