У меня есть модель multioutputclassifier с XGboost и scikit-learn, с 28 классами.Предикат_проба возвращает список из 28 массивов в форме 13412 * 28 (13412 - количество выборок в моем тестовом наборе данных).
У меня есть трудности в интерпретации этих вероятностей.У меня есть список моих классов из clf.classes_, но я сталкиваюсь с проблемами в понимании того, как именно прочитать эти вероятностные массивы.
Y_ml1.shape
(125157L, 28L)
best_XGB = XGBClassifier(base_score=0.5, booster='gbtree', colsample_bylevel=1,
colsample_bytree=0.7, gamma=0.1, learning_rate=0.2,
max_delta_step=0, max_depth=12, min_child_weight=3, missing=None,
n_estimators=100, n_jobs=1, nthread=None,
objective='multi:softprob', random_state=0, reg_alpha=0,
reg_lambda=1, scale_pos_weight=1, seed=None, silent=True,
subsample=1, num_class =len(list(ml.classes_)))
multi_target_classifier = MultiOutputClassifier(best_XGB, n_jobs=1)
multi_target_classifier.fit(m1, Y_ml1)
y_pred_proba = multi_target_classifier.predict_proba(test_x)
len(y_pred_proba)
28
y_pred_proba[0].shape
(13412L, 28L)