Какую модель глубокого обучения использовать для захвата незначительных элементов изображения? - PullRequest
0 голосов
/ 23 января 2019

У меня есть класс, который немного отличается от другого класса: ex - у этого изображения есть пряжка (рассмотрим его как класс) https://6c819239693cc4960b69 -cc9b957bf963b53239339d3141093094.ssl.cf3.rackcdn.com / 1000006329245-822018-Black-Black-1000006329245-822018_01-345.jpg

Но это изображение очень похоже на него, но не имеет пряжки: https://sc01.alicdn.com/kf/HTB1ASpYSVXXXXbdXpXXq6xXFXXXR/latest-modern-classic-chappal-slippers-for-men.jpg

Меня немного смущаетмодель для использования в подобных случаях, которая фактически учитывает значения от пикселя к пикселю.

Любые мысли будут заметны.спасибо !!

Я уже пробовал модели Inception, Resnet и т. д.

С меньшим объемом данных поезда (300-400 вокруг каждого класса) мы можем достичь хорошего отзыва / точности / оценки F1.

1 Ответ

0 голосов
/ 23 января 2019

Возможно, вы захотите изучить трансферное обучение из-за небольшого набора данных. Вы можете использовать перенесенную модель ResNet для работы в качестве экстрактора функций и попробовать на ней алгоритм YOLO (Вы смотрите только один раз), просмотрите каждый окно (Посмотрите реализацию скользящего окна с использованием ConvNets), чтобы получить пряжку ремня и на основании этого вы можете классифицировать изображение.

Основываясь на моем понимании вашего набора данных, чтобы выполнить описанный выше подход, вам потребуется повторно аннотировать ваш набор данных в соответствии с требованиями алгоритма YOLO.

Чтобы посмотреть пример вышеупомянутого подхода, посетите https://mc.ai/implementing-yolo-using-resnet-as-feature-extractor/

Редактировать Если у вас есть аннотированный набор данных XML, и вам нужно преобразовать его в csv, чтобы следовать приведенному выше примеру, используйте https://github.com/datitran/raccoon_dataset

Счастливое моделирование.

...