Я хочу использовать roc_auc_score
для оценки производительности классификатора, но я не уверен, какие параметры ему нужны.
Описание этой функции в документации: документация .
Как видите, для этого требуется y_score
, то есть оценки вероятности положительного класса, но как определить, какой класс положителен? Например, когда я использую predict_proba
, какой столбец мне следует использовать?
Теперь я использую эту функцию следующим образом:
clf = SVC(
kernel = 'linear',
probability = True,
random_state = 1 )
clf.fit(train,train_Labels)
score = np.array(clf.predict_proba(test_values))
auc = roc_auc_score(test_Labels,score[:,1])
train_Labels
и test_Labels
- это одномерные векторы с 0
впереди и 1
сзади: [0,0,0,1,1,1]
.
В обучении и тестировании одна строка представляет образец, а один столбец представляет элемент.
Возможно, неуместно использовать predict_proba
, но в моем проекте есть особые требования, поэтому не беспокойтесь.
Я хочу знать, переданы ли векторы, которые я передал в roc_auc_score
функция как положительная вероятность верна (y_true
и y_score
).
Если что-то неясно по этому вопросу, пожалуйста, спросите меня, я новичок, пожалуйста, прости меня.