Я читаю вашу записную книжку, но меня смущает, почему вы думаете, predict_proba
ужасно ошибочны. Точность предсказания не очень хорошая, или формат predict_proba
не такой, как вы ожидали?
Вы можете использовать sklearn.metrics.accuracy_score()
, sklearn.metrics.confusion_matrix()
, чтобы проверить метку прогнозирования, или использовать sklearn.metrics.roc_auc_score()
, чтобы проверить результат predict_proba
.Проверьте, лучше ли обе части поезда и текста.
Я думаю, что формат predict_proba
правильный, или, может быть, вы можете попробовать predict_log_proba()
для вычисления вероятности записи?
Надеюсь, что это можетпомочь вам.