Руководство H2O описывает, как данные разбиваются для перекрестной проверки в k-кратном размере. Пример приведен для 5-кратной перекрестной проверки.
см. Здесь: http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/nfolds.html, в котором говорится:
"Первые 5 моделей (модели перекрестной проверки) построены на 80% данных обучения и разные 20% удерживаются для каждой из 5 моделей. "
Если было выбрано другое значение сгиба, будут ли эти проценты отличаться, например, предположим, что 10 было выбрано в качестве числа складки, будет ли верно следующее?
'Первые 10 моделей (модели перекрестной проверки) построены на 90% данных обучения, и для каждой из 10 моделей выделены разные 10%.'