Я посмотрел ваш график обучения и проверки. да, ваша модель тренируется, и потери снижаются, но ваша ошибка проверки составляет около 50%, что означает «случайное предположение».
Возможные причины -
1- Из-за ошибки поезда (который представлен на изображении между 50-100 эпохами), ошибка в среднем снижается, но она случайная. например, ваша ошибка в эпоху 100 почти одинакова в эпоху 70. Это может быть связано с тем, что ваш набор данных слишком прост и вы заставляете огромную сеть, например эффективную net, перегрузить ее.
2 - это также может быть из-за того, как вы его настраиваете, могут быть любые проблемы. например, какие слои вы заморозили и для какого слоя вы берете градиенты при выполнении BP. Я предполагаю, что вы используете предварительно обученные веса.
3- Проблема с оптимизатором. попробуйте использовать Адама
Было бы замечательно, если бы вы могли обеспечить общие потери (с эпохи 1 - 100).