Тот же код, но граф ROC рисуется по-разному - PullRequest
0 голосов
/ 25 июня 2019

Я запускаю тот же код, что и файл примера, но рисуется другая кривая R O C

https://data.world/deviramanan2016/nki-breast-cancer-data

import pandas as pd

from sklearn.model_selection import train_test_split 
import yellowbrick as yb

pd.set_option('display.max_columns', None)

data_raw = pd.read_csv("data/NKI_cleaned.csv") 

features_to_drop = data_raw.columns[16:] 
data_subset = data_raw.drop(features_to_drop, axis=1) 
X = data_subset.drop(['Patient', 'ID', 'eventdeath'], axis=1) 
y = data_subset['eventdeath']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

from sklearn.linear_model import LogisticRegression 
logreg = LogisticRegression()
logreg.fit(X_train, y_train)
logreg_pred = logreg.predict(X_test) 

from sklearn.metrics import accuracy_score
logreg_acc_score = accuracy_score(y_test, logreg_pred) 
print(logreg_acc_score) 
from yellowbrick.classifier import ROCAUC 
logreg_roc = ROCAUC(logreg) 

logreg_roc.fit(X_train, y_train)
logreg_roc.score(X_test, y_test)
logreg_roc.poof()

Файл примера имеет одну кривую ROC. Файл, который я запускаю, имеет четыре ROC-кривых. Описание изображения здесь

пример кода - кривая ROC

мой код - кривая ROC

Я использовал ноутбук Юпитера.

...