Использование функции sklearn precision_recall_curve с различными классификаторами - PullRequest
0 голосов
/ 22 ноября 2018

Это может быть простой вопрос, но мне нужна помощь, чтобы понять, как использовать функцию precision_recall_curve в sklearn.

У меня есть двоичный набор данных, и я использую три классификатора (SVM, RF, LR) для классификацииЭто.

В примере из документации sklearn показано использование этой функции следующим образом:

y_score = classifier.decision_function(X_test)    
precision_recall_curve(y_test, y_score)

В этом примере «solution_function» - это встроенная функция для классификаторов SVM.Однако я не вижу такой функции для классификаторов случайных лесов или линейной регрессии.

Может кто-нибудь помочь мне понять, что такое функция y_score и принятия решения и как я могу рассчитать ее для любого классификатора?

Спасибо!

Ответы [ 2 ]

0 голосов
/ 22 ноября 2018

Для всех других классификаторов, которые не имеют встроенного decision_function, вы должны использовать функцию predict_proba, которая по сути делает то же самое.

y_score = random_forest.predict_proba()
0 голосов
/ 22 ноября 2018

Посмотрите на описание второго параметра в документации precision_recall_curve:

probas_pred: массив, форма = [n_samples]

Расчетное вероятности или решающая функция.

Если decision_function() отсутствует, вы можете использовать predict_proba() вместо него.

...