Я запускаю тот же код, что и файл примера, но рисуется другая кривая R O C
https://data.world/deviramanan2016/nki-breast-cancer-data
import pandas as pd
from sklearn.model_selection import train_test_split
import yellowbrick as yb
pd.set_option('display.max_columns', None)
data_raw = pd.read_csv("data/NKI_cleaned.csv")
features_to_drop = data_raw.columns[16:]
data_subset = data_raw.drop(features_to_drop, axis=1)
X = data_subset.drop(['Patient', 'ID', 'eventdeath'], axis=1)
y = data_subset['eventdeath']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)
from sklearn.linear_model import LogisticRegression
logreg = LogisticRegression()
logreg.fit(X_train, y_train)
logreg_pred = logreg.predict(X_test)
from sklearn.metrics import accuracy_score
logreg_acc_score = accuracy_score(y_test, logreg_pred)
print(logreg_acc_score)
from yellowbrick.classifier import ROCAUC
logreg_roc = ROCAUC(logreg)
logreg_roc.fit(X_train, y_train)
logreg_roc.score(X_test, y_test)
logreg_roc.poof()
Файл примера имеет одну кривую ROC. Файл, который я запускаю, имеет четыре ROC-кривых. Описание изображения здесь
пример кода - кривая ROC
мой код - кривая ROC
Я использовал ноутбук Юпитера.