Мне нужно установить значение для определенного порога и сгенерировать матрицу путаницы. Данные находятся в CSV-файле (11,1 МБ), эта ссылка для загрузки: https://drive.google.com/file/d/1cQFp7HteaaL37CefsbMNuHqPzkINCVzs/view?usp=sharing?
Сначала я получил сообщение об ошибке: «« AttributeError: Forex_proba недоступен, когда вероятность = ложь »«Поэтому я использовал это для исправления:
svc = SVC(C=1e9,gamma= 1e-07)
scv_calibrated = CalibratedClassifierCV(svc)
svc_model = scv_calibrated.fit(X_train, y_train)
Я много видел в Интернете, и я не совсем понял, как происходит пероланализация определенного порогового значения. Звучит довольно сложно. Теперь я вижу неправильный вывод:
array([[ 0, 0],
[5359, 65]])
Я понятия не имею, что не так.
Мне нужна помощь, и я новичок в этом. спасибо
from sklearn.model_selection import train_test_split
df = pd.read_csv('fraud_data.csv')
X = df.iloc[:,:-1]
y = df.iloc[:,-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)
def answer_four():
from sklearn.metrics import confusion_matrix
from sklearn.svm import SVC
from sklearn.calibration import CalibratedClassifierCV
from sklearn.model_selection import train_test_split
svc = SVC(C=1e9,gamma= 1e-07)
scv_calibrated = CalibratedClassifierCV(svc)
svc_model = scv_calibrated.fit(X_train, y_train)
# set threshold as -220
y_pred = (svc_model.predict_proba(X_test)[:,1] >= -220)
conf_matrix = confusion_matrix(y_pred, svc_model.predict(X_test))
return conf_matrix
answer_four()
Эта функция должна возвращать запутанную матрицу, массив 2x2 с 4 целыми числами.