Понимать выходные данные для предиката_процесса для модели MultiOutputClassifier XGBoost - PullRequest
0 голосов
/ 15 апреля 2019

У меня есть модель multioutputclassifier с XGboost и scikit-learn, с 28 классами.Предикат_проба возвращает список из 28 массивов в форме 13412 * 28 (13412 - количество выборок в моем тестовом наборе данных).

У меня есть трудности в интерпретации этих вероятностей.У меня есть список моих классов из clf.classes_, но я сталкиваюсь с проблемами в понимании того, как именно прочитать эти вероятностные массивы.

Y_ml1.shape

(125157L, 28L)

best_XGB = XGBClassifier(base_score=0.5, booster='gbtree', colsample_bylevel=1,
       colsample_bytree=0.7, gamma=0.1, learning_rate=0.2,
       max_delta_step=0, max_depth=12, min_child_weight=3, missing=None,
       n_estimators=100, n_jobs=1, nthread=None,
       objective='multi:softprob', random_state=0, reg_alpha=0,
       reg_lambda=1, scale_pos_weight=1, seed=None, silent=True,
       subsample=1, num_class =len(list(ml.classes_)))

multi_target_classifier = MultiOutputClassifier(best_XGB, n_jobs=1)
multi_target_classifier.fit(m1, Y_ml1)
y_pred_proba = multi_target_classifier.predict_proba(test_x)
len(y_pred_proba)

28

y_pred_proba[0].shape

(13412L, 28L)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...