Добавленный отсев уменьшает эффект переобучения; по сути, это причина, по которой график потерь не колеблется так сильно, как в случае отсутствия отсева / добавления каких-либо других регуляризаций.
Даже если точность набора проверки может быть немного лучше (1-2 % процента больше) в случае модели без выпадения / регуляризации следует ожидать, что вторая модель (с включенным выпадением) будет лучше работать с невидимыми данными (набор тестов).
Следует выбрать модель отсева; Кроме того, вы можете попробовать поэкспериментировать с различными пороговыми значениями отсева, чтобы проверить производительность. Кроме того, было бы неплохо иметь тестовый набор, чтобы быстро проверить все ваши предположения.
Обратите внимание, что вы используете набор проверки в качестве набора тестов, но они имеют разные цели. То, что вы на самом деле показываете, - это потери / неточности при обучении-валидации, а не потеря / неточности в ходе тренировочного теста.