Рецензент моей рукописи рекомендовал разделить мои медицинские данные в наборе обучения / теста. На тренировочном наборе я должен использовать вложенную обертку, ампутируя и фильтруя мои переменные (переменные chi quadrat 10) во внутренней l oop. После создания моей лучшей модели я должен получить к ней доступ на тестовом наборе.
Он хотел, чтобы вменение обучающего набора было сохранено и использовано на тестовом наборе. Он также пожелал, чтобы я сообщил доверительные интервалы показателей эффективности (особенно сбалансированной точности).
task = makeClassifTask(id = "db",data=trainDB,target = "y")
inner = makeResampleDesc("CV", iters = 5)
lrn = makeLearner("classif.randomForest", predict.type ="prob")
lrn2 = makeImputeWrapper(lrn, list(numeric = imputeMean (), factor= imputeMode()))
filter = makeFilterWrapper(lrn2, fw.method ="FSelector_chi.squared", fw.abs = 10, resampling = inner)
outer = makeResampleDesc("CV", iters = 5)
r = resample(learner = filter, task = task, resampling = outer,measures = list(bac,auc,tpr,tnr, ppv, npv), models = TRUE, show.info = FALSE)
Вопрос: Мой основной код в порядке? какие команды я могу ввести для хранения вменения и вычисления доверительных интервалов ?
Спасибо.