Я использую GaussianNB Scikit-Learn, чтобы сделать контролируемую классификацию. При использовании метода «gnestt_proba »сумма вероятностей всегда равна 1.
То, что я хотел бы вернуть, - это реальное значение подобранного гауссовского распределения, потому что мой набор данных содержит много выбросов. Если бы у меня было 3 идентифицированных категории, я бы хотел, чтобы модель говорила мне: «10% относятся к категории A, 0,5% относятся к категории B и 4% к категории C». Другими словами, это скорее всего выброс.
Склеарн также возвращает этот результат? Должен ли я сделать математику на основе среднего и стандартного отклонения?