Я прохожу курс, где использую mnist di git данные считывателя для прогнозирования цифр с logisti c -регрессии, Я использую упрощенные данные только с 2 результатами, 2 и 7. Но по ходу дела кажется, что уровни факторов (2 и 7) поменялись местами?
Чтобы добраться туда, где я нахожусь:
library(dslabs)
data("mnist_27")
x_1 и x_2 - это значения из первых двух предикторов (столбцов). Теперь, чтобы соответствовать logistic model
:
fit_glm <- glm(y~x_1 + x_2, data=mnist_27$train, family="binomial")
p_hat_logistic <- predict(fit_glm, newdata=mnist_27$test)
y_hat_logistic <- factor(ifelse(p_hat_logistic > 0.5, 7, 2))
Вот здесь и возникает моя проблема. В последней строке, почему функция должна предсказывать 7, если p_hat_logistic > 0.5
? В mnist_27$test$y
уровни факторов равны 2
& 7
. Так как первый уровень - 2
, разве мы не должны предсказать 2
, если p_hat_logistic > 0.5
? Но это не работает, так как приводит к снижению точности.