Я хотел бы проверить результат перекрестной проверки без проверки для моего довольно маленького значения df в h2o.Это мой ввод df: https://drive.google.com/file/d/1UiIkxlHCq1tJZNOH6hQD30gEMaPdmhgh/view?usp=sharing
Можно ли установить параметр nfolds (т.е. nfolds = nrow (df)) в h2o, чтобы получить такую перекрестную проверку?Я не могу установить nfolds> 25 для nrow (df) = 69.
u$dc=as.factor(u$dc)
train <- as.h2o(u)
model <- h2o.gbm(x= colnames(train)[1:15],
y="dc", training_frame=train,
nfolds = 25,
learn_rate = 0.06,
ntrees = 90, max_depth = 3,
min_rows = 2,
distribution = "bernoulli")
Я получаю исключение в приведенном выше коде:
Error: water.exceptions.H2OIllegalArgumentException:
Not enough data to create 25 random cross-validation splits. Either reduce nfolds, specify a larger dataset
Он генерируется в ModelBuilder.java:
at hex.ModelBuilder.cv_makeWeights(ModelBuilder.java:357)
at hex.ModelBuilder.computeCrossValidation(ModelBuilder.java:276)
at hex.ModelBuilder$1.compute2(ModelBuilder.java:207)
at water.H2O$H2OCountedCompleter.compute(H2O.java:1263)
at jsr166y.CountedCompleter.exec(CountedCompleter.java:468)
at jsr166y.ForkJoinTask.doExec(ForkJoinTask.java:263)
at jsr166y.ForkJoinPool$WorkQueue.runTask(ForkJoinPool.java:974)
at jsr166y.ForkJoinPool.runWorker(ForkJoinPool.java:1477)
at jsr166y.ForkJoinWorkerThread.run(ForkJoinWorkerThread.java:104)