Я работаю над набором данных о раке молочной железы штата Висконсин, моя цель - создать модель, которая обладает хорошей точностью и 100% чувствительностью.Я знаю, что для достижения этого я должен работать с порогами.Проблема в том, что я не понимаю, как работают пороги и как я могу правильно их выбрать.
Я учусь на известной книге Intro to SL (с приложениями в R), но я несмог найти объяснение выбора порога в главе 4.
Вот код, который я написал до сих пор:
df <- subset(df, select = -c(X, id)) # Selecting features
set.seed(4)
# Train and test
nrows <- NROW(df)
index <- sample(1:nrows, 0.7 * nrows)
traindf <- df[index,]
testdf <- df[-index,]
glm.fit=glm(diagnosis~., data=traindf ,family=binomial)
glm.probs=predict(glm.fit,testdf,type="response")
glm.pred=rep("B",dim(tested)[1])
glm.pred[glm.probs >.5]="M"
table(glm.pred, testdf[,1])
Теперь это дает мне
glm.pred B M
B 108 3
M 4 56
Я хочу поставить 0 в верхнем правом углу таблицы, но изменение порогов не работает.
Как решить проблему?
То же самое и сфункция парня (которую я здесь избегаю).
Спасибо