Я попробую ответить примером.
Если я тренирую нейронную сеть или выполняю линейную регрессию и использую только данные обучения и тестирования, я могу проверить потерю тестовых данных для каждой итерации и остановиться, когда потеря тестовых данных начнет расти или получить снимок модели с наименьшими испытательными потерями.
В некотором смысле это «переизбыток» моих тестовых данных, так как я решаю, когда остановиться, основываясь на этом.
Если я использовал данные испытаний, обучения и проверки, я могу выполнить ту же процедуру, что и выше, с проверкой вместо данных проверки, а затем, после того как я решу, когда моя модель будет выполнена, я смогу проверить ее на никогда ранее просмотрели данные испытаний, чтобы дать мне более объективную оценку моих предсказаний моделей.
Что касается второй части вопроса, я бы предложил относиться, по крайней мере, к данным испытаний как к независимым, и по-разному исчислять отсутствующие данные, но это зависит от ситуации и данных.