Предсказать вероятность предсказанного класса - PullRequest
0 голосов
/ 27 апреля 2019

мл для начинающих здесь.

У меня есть набор данных, содержащий рейтинги GPA, GRE, TOEFL, SOP & LOR (из 5) и т. Д. (все числовые) и последний столбец, в котором указывается, были ли они приняты в университет (0 или 1), что мы будем использовать как y_train. Я должен не только классифицировать прогнозируемые ярлыки, но и рассчитывать вероятность того, что каждый человек будет принят.

edit: так что из первого комментария я построил модель логистической регрессии, и с некоторым поиском в поиске я нашел в поле «предсказание_proba» из sklearn и попытался реализовать его. Там не было каких-либо синтаксических ошибок, но кодовые значения, указанные вgnast_proba, были ужасно неправильными.

Ссылка: https://github.com/tarunn2799/gre-pred/blob/master/GRE%20Admission%20Probability-%20Extraaedge.ipynb

, пожалуйста, помогите мне найти, где я ошибся, а также советы, чтобы уменьшить потери

спасибо!

1 Ответ

0 голосов
/ 28 апреля 2019

Я читаю вашу записную книжку, но меня смущает, почему вы думаете, predict_proba ужасно ошибочны. Точность предсказания не очень хорошая, или формат predict_proba не такой, как вы ожидали?

Вы можете использовать sklearn.metrics.accuracy_score(), sklearn.metrics.confusion_matrix(), чтобы проверить метку прогнозирования, или использовать sklearn.metrics.roc_auc_score(), чтобы проверить результат predict_proba.Проверьте, лучше ли обе части поезда и текста.

Я думаю, что формат predict_proba правильный, или, может быть, вы можете попробовать predict_log_proba() для вычисления вероятности записи?

Надеюсь, что это можетпомочь вам.

...