Это зависит от того, какова ваша конечная цель. K-Fold CV используется для поиска гиперпараметров модели.
После этого этапа вы можете изменить свой проверочный набор данных и обучить его модели на нем.
Если вы хотите использовать как можно больше данных (выполняя прогнозы), было бы неплохо обучить N
моделей на N
различных сгибах и объединить их прогнозы. Этот похож на boostrap, в целом, ваш ансамбль видел все данные, но он не переписывался. Этот подход в N
раз требует больших вычислительных ресурсов, поэтому он все равно сводится к вашим целям.
Наконец, вы должны получить лучшие результаты при подгонке разных моделей к своим сгибам вместо одной, но для этого потребуется отдельное пространство для гиперпараметров для каждого алгоритма.