Как рассчитывается точность модели бинома glm в карете? - PullRequest
0 голосов
/ 07 июня 2018

Я тренирую биномиальную модель glm в каре для классификации мошенничества (0 означает мошенничество и 1 означает мошенничество):

model.lr <- train(fraud_ind ~ var1 + var2 + var3,
                  data = d_train, method = 'glm', family = 'binomial', trControl=tr_ctrl

Я вижу вывод модели:

> model.lr
Generalized Linear Model 

90826 samples
    3 predictors
    2 classes: '0', '1' 

No pre-processing
Resampling: Cross-Validated (15 fold, repeated 5 times) 
Summary of sample sizes: 84772, 84771, 84770, 84772, 84771, 84770, ... 
Resampling results:

  Accuracy  Kappa   
  0.866818  0.733636

Я полагаю, что точность должна быть связана с некоторым порогом, но модель не показала мне, какой порог использовался для классификации.Любая идея о том, как именно эта точность основана?

1 Ответ

0 голосов
/ 07 июня 2018

Последующие наблюдения:

После того, как я опубликовал свой вопрос, я провел некоторый подробный анализ, сравнив предсказанную вероятность и результаты классификации.

u = прогнозирование (model.lr, d_train, type = 'raw')

v = прогнозирование (model.lr, d_train, type = 'prob')

w <- data.frame (u, v) </p>

Просмотр (w)

введите описание изображения здесь

ВНа рисунке X1 - это прогнозируемая вероятность «мошенничества», а X0 - вероятность «мошенничества».первый столбец U - результаты двоичной классификации.Мы можем ясно видеть, что отсечка составляет 0,5.

...