Получение ошибки «Совокупная скорость захвата должна быть 1,0» при использовании поиска по сетке H2O с оценщиком случайных лесов и столбцом веса - PullRequest
0 голосов
/ 20 марта 2019

Я выполняю GridSearch с оценщиком Random Forest следующим образом:

drf = H2ORandomForestEstimator(ntrees=5, max_depth=35 , weights_column="weights", nfolds=5, stopping_rounds=15, seed=55)

estimator = H2ORandomForestEstimator(weights_column="weights", nfolds=5, stopping_rounds=11, seed=55)

criteria = {
    "strategy": "RandomDiscrete",
    "stopping_tolerance": 0.001,
    "stopping_metric":"auc"
}

hyper_parameters = {
   'ntrees': [50, 100,200],
   'max_depth': [5, 10, 25, 50],
   'fold_assignment':['Stratified', 'Random']
}

gs = H2OGridSearch(estimator, hyper_params=hyper_parameters, search_criteria=criteria)

Затем, когда я пытаюсь тренироваться на объекте поиска по сетке со следующей строкой, я получаю ошибку, найденную ниже:

gs.train(x=predictors, y=response, training_frame=train_data, validation_frame=valid_data)


[OSError]: Job with key $03017f00000132d4ffffffff$_a07c1ae3a0a84dd4fa6dfc7a46904232 failed with an exception: java.lang.AssertionError: Cumulative capture rate must be 1.0, but is 0.9918032786885246
...