Как обучать и прогнозировать данные по обучению / тестированию отдельно в R? - PullRequest
0 голосов
/ 06 ноября 2019

Мы используем следующий код для k-кратных обучающих данных перекрестной проверки, когда у нас есть один файл данных,

rand_ctrl <- trainControl(method = "repeatedcv", repeats = 5,search = "grid")

set.seed(308)

rand_search <- train(
    Effort ~ ., data = d,
    method = "svmRadial",
    ##Create 20 random parameter values
    tuneLength = 20,
    metric = "RMSE",
    preProc = c("center", "scale"),
    trControl = rand_ctrl
) 

Но если у нас есть данные в двух отдельных файлах train1 и test1, как мы можемиспользовать функцию trainControl и train? что указать в аргументе метода в trainControl?

1 Ответ

0 голосов
/ 06 ноября 2019

В trainControl вам не нужно указывать данные. В функции train вы должны указать такие данные, как

#Model training
    set.seed(308) 
    rand_search <- train(Effort ~ ., data = train1 ,
                                                method = "svmRadial",
                                                 ## Create 20 random parameter values
                                                 tuneLength = 20,
                                                 metric = "RMSE",
                                                 preProc = c("center", "scale"),
                                                 trControl = rand_ctrl)

, а test1 следует использовать для прогнозирования, например,

    #For calibration
        models_cal <- predict(rand_search, newdata = train1)
    #For independent validation
        models_val <- predict(rand_search, newdata = test1)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...