Я тренирую модель CNN (сделанную с использованием Keras). Входные данные изображения имеют около 10200 изображений. Есть 120 классов для классификации. Составляя график частоты данных, я вижу, что выборочные данные для каждого класса более или менее однородны с точки зрения распределения.
Проблема, с которой я сталкиваюсь, заключается в том, что график потерь для обучающих данных снижается с эпохами, но для проверочных данных это сначалападает, а затем продолжает расти. График точности отражает это. Точность для обучающих данных в конечном итоге устанавливается на уровне 0,94, но для проверочных данных она составляет около 0,08.
В основном это случай перебора.
Я использую скорость обучения 0,005 и отсев 0,25.
Какие меры я могу предпринять, чтобы повысить точность проверки? Возможно ли, что размер выборки для каждого класса слишком мал, и мне может потребоваться увеличение данных, чтобы получить больше точек данных?