Значение K
указывает количество сгибов, на которые вы планируете разбить набор данных. Меньшие значения K
означают, что набор данных разбит на меньшее количество частей, но каждая часть содержит больший процент набора данных.
Взятие набора данных со 100 строками.
- 2Проверка поперечного сгиба - каждая складка будет содержать 50 строк.
- Проверка перекрестного сгиба - Каждая складка будет содержать 10 строк.
Таким образом, при обучении проверка перекрестного сгиба будет 10иметь разделение теста поезда на 90-10, при этом в качестве 2-кратной перекрестной проверки будет разделено тестирование поезда на 50-50.
Использование большего количества сгибов предоставит модели больше данных для обучения,но потребуется гораздо больше времени, так как он должен тренироваться и проверять K
раз.