Может случиться так, что, во-первых, ваша основная концепция очень проста, что приводит к очень низкой ошибке проверки на раннем этапе. Во-вторых, ваше увеличение данных затрудняет обучение, что приводит к более высокой ошибке обучения.
Тем не менее, я бы все же провел пару экспериментов в вашем случае. Во-первых: разделите данные на 10/90 вместо 90/10 и посмотрите, как тогда изменится ваша ошибка проверки - надеюсь, вы увидите какую-то кривую между (теперь более короткими и более сложными) эпохами. Во-вторых, я бы запустил валидацию перед обучением (или после эпохи 1 партии), чтобы получить случайный результат.