У меня проблема двоичной классификации с несбалансированными данными (соотношение 1:17). Я пытаюсь использовать CNN для классификации. Я хочу оптимизировать скорость обучения и количество ядер свертки (глубину фильтра), используя байесовскую оптимизацию. Мои показатели метрики довольно сумасшедшие, я имею в виду, высокая чувствительность обычно имеет низкую точность и специфичность, и наоборот.
Я знаю, что у меня могла бы быть просто отрицательная точность потери моей функции f_min, но в моем случае это приведет к очень высокой точности и специфичности, но очень низкой чувствительности. Подскажите, пожалуйста, как у меня может быть функция потерь, которая учитывает как специфичность, так и чувствительность?
Я пробовал взвешенную функцию, но чувствовал, что она не дает наилучших результатов.
Вот образец моих типичных оценок.
| ACC | SEN | SPE | MCC | AUC |
| 0,85 | 0,17 | 0,89 | 0,05 | 0,53 |
| 0,76 | 0,40 | 0,79 | 0.10 | 0,59 |
| 0,73 | 0,45 | 0,75 | 0.10 | 0,60 |
| 0,90 | 0,07 | 0,95 | 0,03 | 0,51 |
| 0,68 | 0,53 | 0,69 | 0,11 | 0,61 |
Я также не хочу застрять в функции потерь, которая нацелена на получение всех 3 баллов в 60-х годах и считает это лучшим.
Очень ценю любые предложения. Спасибо.