выберите пороги для 100% чувствительности в glm и lda (wbcd, R) - PullRequest
1 голос
/ 09 июля 2019

Я работаю над набором данных о раке молочной железы штата Висконсин, моя цель - создать модель, которая обладает хорошей точностью и 100% чувствительностью.Я знаю, что для достижения этого я должен работать с порогами.Проблема в том, что я не понимаю, как работают пороги и как я могу правильно их выбрать.

Я учусь на известной книге Intro to SL (с приложениями в R), но я несмог найти объяснение выбора порога в главе 4.

Вот код, который я написал до сих пор:

df <- subset(df, select = -c(X, id)) # Selecting features
set.seed(4)


# Train and test
nrows <- NROW(df)                        
index <- sample(1:nrows, 0.7 * nrows)  
traindf <- df[index,]                   
testdf <- df[-index,]

glm.fit=glm(diagnosis~., data=traindf ,family=binomial)
glm.probs=predict(glm.fit,testdf,type="response")
glm.pred=rep("B",dim(tested)[1])
glm.pred[glm.probs >.5]="M"
table(glm.pred, testdf[,1])

Теперь это дает мне

glm.pred   B   M
       B 108   3
       M   4  56

Я хочу поставить 0 в верхнем правом углу таблицы, но изменение порогов не работает.

Как решить проблему?

То же самое и сфункция парня (которую я здесь избегаю).

Спасибо

...