Question

Руководство H2O описывает, как данные разбиваются для перекрестной проверки в k-кратном размере. Пример приведен для 5-кратной перекрестной проверки.

см. Здесь: http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/nfolds.html, в котором говорится:

"Первые 5 моделей (модели перекрестной проверки) построены на 80% данных обучения и разные 20% удерживаются для каждой из 5 моделей. "

Если было выбрано другое значение сгиба, будут ли эти проценты отличаться, например, предположим, что 10 было выбрано в качестве числа складки, будет ли верно следующее?

'Первые 10 моделей (модели перекрестной проверки) построены на 90% данных обучения, и для каждой из 10 моделей выделены разные 10%.'

Erin LeDell · Answer 1 · 04 мая 2020

Да, вы правы. Процент данных, используемых для обучения, определяется количеством сгибов.

Изменяет ли nfolds, выбранный для перекрестной проверки H2O, процент используемых данных?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Изменяет ли nfolds, выбранный для перекрестной проверки H2O, процент используемых данных?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы