Потери, как ожидается, будут меньше, но ваше удивление в той степени, в которой оно понятно,
Причина, по которой вторая эпоха имеет такие меньшие потери, заключается в том, что в течение первой эпохи ваша модель делает ошибки и уступает большие потери - которые становятся все лучше и лучше. Keras отображает средние потери за все случаи в эпоху.
Так что, если модель допустила ошибки в первых 90% обучения в эпоху, а затем была идеальна для последних 10% данных, потери все равно будут очень большими, потому что это означает потерю.
Тогда, в начале 2-й эпохи, модель уже лучше прогнозирует, поэтому означает потеря снизить.