Это похоже на то, что архитектура модели проста и в режиме поезда не может захватить элементы в данных и, следовательно, подвергается недостаточному оснащению.
eval()
отключает выпадение и нормализацию пакетов, среди других модулей.
Это означает, что модель тренируется лучше без отсева, что помогает модели учиться лучше с большим количеством нейронов, также помогает увеличение размера слоя, увеличение количества слоев, уменьшение вероятности отсева.