Попытка найти, насколько похож один столбец на другой в датафрейме. - PullRequest
0 голосов
/ 25 июня 2019

Я пытаюсь рассчитать коэффициент точности.

У меня есть пандас с несколькими столбцами данных.

У меня есть один столбец прогнозируемых оттоков и один столбец истинных оттоков для каждого клиента.

Есть ли способ рассчитать метрику точности и другие метрики только между двумя столбцами?Оба столбца являются двоичными: 0 как отток и 1 как отток.

1 Ответ

3 голосов
/ 26 июня 2019

Очевидно, что вы можете измерить точность прогноза по известным ответам. Поскольку вы отметили это с помощью машинного обучения и Python, я предлагаю использовать в качестве первого прохода матрицу путаницы (она же матрица ошибок). В библиотеке Python Scikit-learn есть модуль, который вы можете использовать:

from sklearn.metrics import confusion_matrix
y_true = ...
y_pred = ...
confusion_matrix( y_true, y_pred )

источник: https://scikit -learn.org / stable / modules / Генерируемый / sklearn.metrics.confusion_matrix.html

...