Если переобучения нет, это в основном означает, что сложность модели не так велика. Что на самом деле хороший знак. Однако для отладки таких случаев вы должны следовать следующему пути:
- Увеличивайте архитектуру модели (и сложность) до тех пор, пока вы не достигнете необходимого KPI для данных обучения, что может привести к переобучению. В случае вашего MLP это будет количество слоев и узлов на слой.
- Подтвердите модель. Если
- точность проверки сопоставима, все в порядке
- Если точность проверки ниже, вам нужно добавить больше данных или уменьшить сложность модели, упорядочить
Сложная часть состоит в том, как увеличить сложность модели таким образом, чтобы она давала вам требуемый KPI, но не требовала большого количества данных. Свертки являются примером, в котором используется инвариант перевода. Теоретически вы можете добиться того же, используя полностью подключенный слой, однако по той цене, что вам потребуется гораздо больше обучающих данных.