Да, ваше понимание верно. Данные валидации предназначены для того, чтобы дать вам представление о том, как ваша модель ведет себя на реальных невиданных примерах, например, на тестовых данных.Таким образом, вы должны сохранить его реальным и не испортить его с помощью дополнения.
Теперь к 10-кратной перекрестной проверке: вступают в силу инженерные соображения. Это вычислительно дорого делать увеличение?Возможно, вы можете предварительно вычислить дополненные данные и выбрать оригинал + дополненный для обучения и только оригинал для проверки.Вы хотите, чтобы объемы дополненных данных были бесполезными и / или было ли это легко?Делайте это на лету, возможно, как часть выборки из набора данных.
Я не могу помочь вам с вопросом о бонусе TF, но есть хороший пример объединения вещей в PyTorch,