Возможно, я искал неправильные ключевые слова, чтобы найти решение этой проблемы, но до сих пор не нашел ответа в Интернете.
Ситуация: я обучил модель логистической регрессии с регуляризацией в R с помощью пакета CARET для классификации двух классов. С помощью модели я затем предсказал классы моего обучения и проверки, чтобы получить матрицу путаницы и измерить производительность модели.
Вопрос: Теперь я хотел бы определить объекты, которые имеют неправильный класс, в соответствии с моей моделью. То есть те, которые либо предсказаны как «Да», когда на самом деле они принадлежат классу «Нет», и наоборот, в матрице путаницы. Я хотел бы сделать это, чтобы осмотреть объекты, чтобы улучшить или изменить функции, чтобы получить лучшую модель. То, что я хотел бы знать, это их позиция в кадре данных.
Мои соответствующие коды:
set.seed(1)
datapart <- createDataPartition(m$class, p = .85, list = FALSE)
train <- m[datapart ,]
validation <- m[-datapart ,]
library(glmnet)
set.seed(1)
glmnetcontrol <- trainControl(method="repeatedcv", number=10, repeats=3, classProbs = TRUE, summaryFunction = twoClassSummary, search = "random")
glmnet <- train(class~., data=train, method="glmnet", trControl = glmnetcontrol, metric="ROC")
predict_validation <- predict(glmnet, validation, type="raw")
predict_train <- predict(glmnet, train, type="raw")
quality_glmnet_valid <- confusionMatrix(predict_validation , validation$class)
quality_glmnet_train <- confusionMatrix(predict_train , train$class)