Оценка Бриера, в основном среднеквадратическая ошибка, является известной и действительной функцией потерь для классификационных моделей, использующих оценки вероятности;Я также хотел бы взглянуть на это.
К вашей конкретной проблеме вы хотите сравнить вероятности, возвращаемые для вашего целевого класса, то есть для проблемы двоичного класса:
from sklearn.metrics import brier_score_loss
probs = your_model.predict_proba(X_test)
brier_score_loss(y_true, probs[:, 1])
Iя не уверен, что brier формально определен для задач мультикласса.Я хотел бы указать на идею средней ошибки неправильной классификации, которая усредняет ошибку по классам.
Чтобы использовать это в API-интерфейсе sklearn, кодируйте свое y_true категорически, то есть каждый класс получает свой собственный столбец, и вызывайте
sklearn.metrics.mean_squared_error (y_true, probs, multioutput ='iform_average ')