Сначала я объясню, как создается оценка.
Показатель достоверности, отображаемый на краю рамки, представляет собой результат model faster_rcnn_resnet_101
. Вот как это генерируется.
Вышеприведенный рисунок заимствован из Fast R-CNN, но для части предиктора коробки Faster R-CNN имеет такую же структуру. Мы начинаем со слоя пула ROI, все предложения по регионам (на карте объектов) проходят через слой пула и будут представлены в виде векторов объектов фиксированной формы, затем через полностью связанные слои и станут вектором объектов ROI , как показано на рисунке. Теперь один и тот же вектор признаков ROI будет подан в классификатор softmax для прогнозирования класса и регрессор bbox для регрессии ограничивающего прямоугольника. Вот как они выглядят на графике тензорного потока.
На графике узлы Flatten и Flatten_1 получают один и тот же тензор объектов и выполняют операцию выравнивания (после операции flatten они фактически являются вектором объектов ROI на первом рисунке), и они остаются одинаковыми. Теперь мы сосредоточимся на ClassPredictor , потому что это фактически даст окончательные предсказания класса.
На рисунке выше показано, что находится внутри ClassPredictor. Это фактически полностью связанный слой, как показано на первом рисунке. Выходной тензор имеет форму 64 * 24 на рисунке и представляет 64 прогнозируемых объекта, каждый из которых является одним из 24 классов (23 класса с 1 фоновым классом). Таким образом, для каждого объекта выходной сигнал представляет собой вектор 1x24, показатель достоверности 99% и 100% является наибольшим значением в векторе.
Итак, что касается вашего вопроса, доверительная оценка не определяется, но результат модели, есть доверительная оценка порог , который вы можете определить в функции визуализации, все оценки больше этого порога будет отображаться на изображении. Таким образом, вы не можете изменить показатель доверия, если вы не переучите модель и / или не предоставите больше данных для обучения. На вашем рисунке 99% обнаружение планшета будет классифицироваться как ложно-положительный при расчете точности.
И решение этой проблемы состоит в том, чтобы добавить больше обучающих данных и / или обучить больше шагов (но не переоснащать)