Изменяет ли nfolds, выбранный для перекрестной проверки H2O, процент используемых данных? - PullRequest
0 голосов
/ 04 мая 2020

Руководство H2O описывает, как данные разбиваются для перекрестной проверки в k-кратном размере. Пример приведен для 5-кратной перекрестной проверки.

см. Здесь: http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/nfolds.html, в котором говорится:

"Первые 5 моделей (модели перекрестной проверки) построены на 80% данных обучения и разные 20% удерживаются для каждой из 5 моделей. "

Если было выбрано другое значение сгиба, будут ли эти проценты отличаться, например, предположим, что 10 было выбрано в качестве числа складки, будет ли верно следующее?

'Первые 10 моделей (модели перекрестной проверки) построены на 90% данных обучения, и для каждой из 10 моделей выделены разные 10%.'

1 Ответ

2 голосов
/ 04 мая 2020

Да, вы правы. Процент данных, используемых для обучения, определяется количеством сгибов.

...