Мне нужно найти лучшую точку отсечения для построения матрицы путаницы в моей задаче классификации. Я использовал следующий код:
pred=GradientBoostingClassifier.predict_proba(tst_X)[:,1]
fpr, tpr, threshold = roc_curve(target, predicted)
i = np.arange(len(tpr))
roc = pd.DataFrame({'tf' : pd.Series(tpr-(1-fpr), index=i), 'threshold' : pd.Series(threshold, index=i)})
roc_t = roc.iloc[(roc.tf-0).abs().argsort()[:1]]
return list(roc_t['threshold'])
Я не уверен, что это лучшее решение для решения этой проблемы? И это приводит / предсказывает много положительных образцов, что далеко от реальности в моем случае !? есть идеи для лучшего решения?!