В этом случае мне нужно осмотреть недавно установленный продукт, используя компьютерное зрение, чтобы обнаружить отсутствие каких-либо компонентов, которые мне нужно проверить.
Для этой задачи я попробовал концепцию обнаружения областей интересов, которые в этом случае являются компонентами, которые я хочу проверить. Я перешел к подходу, использующему API обнаружения объектов Тензорного потока , который обучил бы модели обнаружению компонентов, которые я хотел проверить, используя аннотированные изображения. В этом случае все изображения содержали только присутствие компонента.
Результаты были очень хорошими при использовании проверочных изображений, но, к сожалению, дает много ложных срабатываний (случаи, когда компонент отсутствует, но он все еще записывает поле на его области), иногда с вероятностью 99% + (исключая мой шанс отфильтровать эти случаи), а с другой стороны, есть случаи, которые он вообще не может найти, с человеческой точки зрения, очень четкий компонент.
Получив эти результаты, я попытался обучить модель как положительным, так и отрицательным случаям (наличие / отсутствие), надеясь, что она узнает разницу между ними. Опять же, ложные срабатывания появились, на этот раз с меньшей частотой, но, учитывая, что мой набор проверки очень мал (около 10 изображений), в глобальной ситуации эта частота ошибок может быть очень высокой, что исключает возможность использования модели в производство.
После нескольких итераций экспериментов я начинаю замечать, что модель очень нестабильна по своим результатам для использования в производстве. Является ли этот подход лучшим способом решения проблемы такого типа?
К сожалению, у меня не так много примеров, чтобы показать проблему, с которой я сталкиваюсь в данный момент, но только для иллюстрации своей проблема, вот два результата подходов, которые я перечислил:
Я уже пробовал использовать все модели, поддерживаемые API, который включает в себя несколько типов fast_rcnn и ssd. Тот, который я придерживаюсь, с лучшим обменом временем обучения и результатами, является более быстрым_rcnn_resnet101 с обучением COCO как предварительное обучение.