Я получаю следующую ошибку при использовании mlr для повторной выборки в лесу условного вывода:
Error in Hmisc::rcorr.cens(-1 * y, s) :
NA/NaN/Inf in foreign function call (arg 1)
Мой код
surv.task <- makeSurvTask(data = bb_imp2, target = c("timeToEvent", "status"))
surv.learner <- makeLearner(cl="surv.cforest", predict.type="response", mtry=5)
rdesc <- makeResampleDesc(method="CV", iters=2)
r = resample(surv.learner, surv.task, rdesc)
r
Для тестирования я сократил данныевсего 3 столбца - время, статус и один предиктор - глюкоза - и в данных отсутствуют значения NA, Inf или NaN.Я могу успешно обучить модель cforest на данных без использования передискретизации:
surv.task <- makeSurvTask(data = bb_imp2, target = c("timeToEvent", "status"))
surv.learner <- makeLearner(cl="surv.cforest", predict.type="response", mtry=5)
blood_cforest <- train(surv.learner, surv.task)
getLearnerModel(blood_cforest)
Random Forest using Conditional Inference Trees
Number of trees: 500
Response: Surv(timeToEvent, status, type = "right")
Input: Glucose
Number of observations: 873
В данных нет символьных переменных.Структура данных:
str(bb_imp2)
'data.frame': 873 obs. of 3 variables:
$ timeToEvent: num 373 2934 397 3005 2930 ...
$ status : int 0 0 0 0 0 0 0 0 0 0 ...
$ Glucose : num 5.2 5.6 6.7 5.5 6.1 5.9 5.8 5.7 7.7 5.5 ...
Почему не работает повторная выборка?Куда мне загрузить файл данных, чтобы другие могли его опробовать?