Я видел документ H2O, говорящий о том, что мы можем использовать весовой столбец во всех почти всех его контролируемых моделях.
Итак, я добавил этот «weight_column» в моей модели DRF и GBM weight_column.
rf_model.train(x=x, y =y, training_frame=htrain, weights_column = 'wgt_col')
Но производительность модели, особенно в тестах и перекрестной проверке, выглядит ужасно, когда я использую следующий код для оценки. Падение AUC с 0,7 для поезда до 0,5 для xval и 0,4 для теста.
rf_model.model_performance(xval = True)
rf_test_perf = rf_model.model_performance(htest)
Возможно ли, что я не использовал 'weights_column' правильно, поэтому AUC рассчитывается без учета веса? Я знаю, partal_plot также необходимо добавить этот весовой параметр. Где-нибудь еще мне нужно добавить этот весовой параметр? Или есть какой-нибудь документ H2O с примером использования веса для поезда, тестирования и проверки?