Моя цель - оценить производительность модели на тестовом наборе данных для задачи обнаружения объектов . Модель была обучена на наборе данных с 6 классами с API обнаружения объектов Tensorflow. Для одного класса существует 20 образцов объектов, а для некоторых это может быть только один образец. Таким образом, данные несбалансированы как для поездов, так и для тестовых наборов. Могу ли я использовать среднюю точность (mAP) в качестве показателей для оценки? Мне кажется, что использовать его для несбалансированных данных некорректно. Поэтому я не знаю, какие еще показатели использовать. Итак, какие метрики подходят для этого случая?
Буду признателен за любую помощь по этому поводу.