Question

Несмотря на то, что повернутые версии не были включены в обучающие изображения, модель обнаружения объектов TensorFlow выводит правильные предсказания ограничивающей рамки.

Это обычное поведение для моделей обнаружения объектов? Если да, что (часть кода или концепции) обеспечивает эту адаптацию?

DomJack · Answer 1 · 28 августа 2018

Простейшим способом инвариантности вращения может быть моделирование путем увеличения набора данных, когда входные изображения искусственно вращаются перед каждой передачей в сеть на разную величину каждый раз.

Вращение обычно ограничено небольшим значением, например, От -30 до 30 градусов - а не полностью случайный, поскольку изображения обычно имеют некоторую стандартную ориентацию, и пространство в сценах, как правило, не является изотропным (то есть вверх отличается от бокового из-за силы тяжести).

Обратите внимание, что эти дополнения не делают сеть по своей природе инвариантной относительно вращения. Однако, если сеть хорошо учится, она должна выучить приблизительную инвариантность вращения.

Другие формы увеличения включают переворот влево-вправо (но не вверх-вниз по той же причине, что и выше), изменение размера и фотометрические изменения, такие как манипуляции оттенком / насыщенностью / контрастом. В некоторых случаях некоторые (или все) из них неуместны. Например, для распознавания рукописного ввода символы являются асимметричными, поэтому переключение влево-вправо не будет целесообразным.

Могут ли модели обнаружения объектов адаптироваться к вращению?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Могут ли модели обнаружения объектов адаптироваться к вращению?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы