У меня есть набор данных, который содержит 43 класса (данные являются изображениями). Этот набор данных несбалансирован, класс меньшинства имеет ≈200 изображений, а класс большинства имеет ≈2000 изображений. Я читал, что SMOTE не оптимален для изображений, потому что он теряет локальные особенности. И я думаю, что 200 изображений в классе также не оптимальны, потому что недостаточно (я думаю), чтобы построить CNN с хорошими результатами.
Что мне делать в этом случае? Стоит ли просто увеличивать данные и игнорировать дисбаланс? Использовать SMOTE? Что вы предлагаете?
Obs: Я много об этом искал, но каждый обнаруженный мной сценарий, использующий SMOTE или другой вид передискретизации, не является изображениями, а коэффициент дисбаланса равен 100: 1 или даже 1000 1.