Почему вы не используете увеличение данных?Попытайтесь вращать, растягивать, изменять любым возможным образом ваш редкий класс, а затем тренироваться для него.
Не тренироваться для него довольно сложно, потому что даже для Imagenet (1000 классов) трудно тренировать"не из вышеупомянутого" класса.Что представляет собой «не яблоко»?
Другое решение состоит в том, чтобы избавиться от вашего слоя softmax и просто использовать выходные данные (возможно, с exp), а затем интерпретировать значения (если оно низкое в первые 3 ")может быть "это 4?)