Прежде всего несколько предварительных пунктов:
было бы полезно узнать, является ли задача двоичной. В этом случае вы получаете производительность, очень близкую к случайному выбору. Так что в основном ваша модель не учится на тренировочном наборе.
Еще одной полезной информацией будет знать, является ли обучающий набор для двух моделей одинаковым (один и тот же тест на расщепление / обучение). Потому что разница 7% между двумя моделями может быть просто случайным шумом из-за разделения выборки.
Наконец, чтобы утверждать, что модель_2 лучше модели_1, вам необходим более глубокий анализ. весьма вероятно, что нет никакой статистической значимости в разнице между этими двумя моделями.
Тот факт, что модель перегружена, говорит о том, что она плохо обобщает набор тестов. Выбрав лучший дизайн, вы сможете улучшить производительность и сделать систему более устойчивой к невидимым образцам. Причина, по которой не следует использовать систему переоснащения, заключается в том, что точность 54% достигается на этом конкретном наборе испытаний / проверок и может значительно отличаться от новых невидимых значений из-за отсутствия обобщения и надежности модели.