Предсказанный класс и соответствующая вероятность на H2O противоречивы - PullRequest
0 голосов
/ 13 сентября 2018

Я применил бинарную классификацию, используя H2O. Я просто разделил свой набор на 3, которые обучают, калибруют и тестируют. После тренировки и калибровки я проверил результаты на тестовом наборе. Вот соответствующая часть:

final_grid = H2OGridSearch(model=H2OGradientBoostingEstimator(model_id = 'contract_gbm2', 
                                    stopping_rounds = 5, stopping_tolerance = 1e-4, seed = 23,
                                    stopping_metric = "AUC",balance_classes = True,
                                    max_runtime_secs=300, calibrate_model=True, calibration_frame=valid,

                                    nfolds = 5),
                       hyper_params=hyper_params_gbm,search_criteria=search_criteria)

Что я заметил, так это то, что предсказанный класс и данные вероятности не всегда согласованы. Смотрите ниже:

enter image description here

Как видно, прогноз не определяется исходя из наибольшей вероятности? Чего мне не хватает?

1 Ответ

0 голосов
/ 13 сентября 2018

Порог макс-F1, а не 0,5.

Если вам не нравится этот порог, конечно, тогда вы можете сравнить p1 с любым порогом, который вам нравится.

...