При выполнении LogisticRegression в Python я получаю разные результаты в матрице путаницы.
# steps
# ------
from sklearn.linear_model import LogisticRegression
logreg = LogisticRegression(random_state=0)
logreg.fit(train_x, train_y)
# prediction
# ------------
pred_y = logreg.predict(test_x)
# confusion matrix
# ------------------
confusion_matrix(pred_y,test_y)
В этом КМ отображаются правильные числа:
[[10683 813]
[ 280 581]]
Когда я использовал запутанную матрицу Панд (которая печатается с заголовками), я получал другой набор чисел.
from pandas_ml import ConfusionMatrix
ConfusionMatrix(pred_y,test_y)
Я получил такой результат:
Predicted False True __all__
Actual
False 3312 127 3439
True 246 10 256
__all__ 3558 137 3695
Числа не совпадают, хотя я использовал одинаковые фактические (test_y
) и прогнозируемые (pred_y
) значения
Буду признателен, если вы поможете мне понять, где я иду не так.