Как автоматически найти оптимальный порог для построения матрицы смешения в задаче классификации с несбалансированными классами? - PullRequest
0 голосов
/ 05 марта 2020

Мне нужно найти лучшую точку отсечения для построения матрицы путаницы в моей задаче классификации. Я использовал следующий код:

 pred=GradientBoostingClassifier.predict_proba(tst_X)[:,1]
 fpr, tpr, threshold = roc_curve(target, predicted)
 i = np.arange(len(tpr)) 
 roc = pd.DataFrame({'tf' : pd.Series(tpr-(1-fpr), index=i), 'threshold' : pd.Series(threshold, index=i)})
 roc_t = roc.iloc[(roc.tf-0).abs().argsort()[:1]]

 return list(roc_t['threshold'])

Я не уверен, что это лучшее решение для решения этой проблемы? И это приводит / предсказывает много положительных образцов, что далеко от реальности в моем случае !? есть идеи для лучшего решения?!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...