Я применил бинарную классификацию, используя H2O. Я просто разделил свой набор на 3, которые обучают, калибруют и тестируют. После тренировки и калибровки я проверил результаты на тестовом наборе. Вот соответствующая часть:
final_grid = H2OGridSearch(model=H2OGradientBoostingEstimator(model_id = 'contract_gbm2',
stopping_rounds = 5, stopping_tolerance = 1e-4, seed = 23,
stopping_metric = "AUC",balance_classes = True,
max_runtime_secs=300, calibrate_model=True, calibration_frame=valid,
nfolds = 5),
hyper_params=hyper_params_gbm,search_criteria=search_criteria)
Что я заметил, так это то, что предсказанный класс и данные вероятности не всегда согласованы. Смотрите ниже:
Как видно, прогноз не определяется исходя из наибольшей вероятности? Чего мне не хватает?