Я хочу создать регуляризованную логистическую регрессионную модель c для прогнозирования класса в наборе данных о раке груди, найденном в пакете OneR. Я хочу поместить все это в аккуратный рабочий процесс с использованием фреймворка tidymodels.
library(tidymodels)
library(OneR)
#specify model
bc.lr = logistic_reg(
mode="classification",
penalty = tune(),
mixture=1
) %>%
set_engine("glmnet")
#tune penalty term using 4-fold cv
cv_splits<-vfold_cv(breastcancer,v=4,strata="Class")
#simple recipe to scale all predictors and remove observations with NAs
bc.recipe <- recipe (Class ~., data = breastcancer) %>%
step_normalize(all_predictors()) %>%
step_naomit(all_predictors(), all_outcomes()) %>%
prep()
#set up a grid of tuning parameters
tuning_grid = grid_regular(penalty(range = c(0, 0.5)),
levels = 10,
original = F)
#put everything together into a workflow
bc.wkfl <- workflow() %>%
add_recipe(bc.recipe) %>%
add_model(bc.lr)
#model fit
tune = tune_grid(bc.wkfl,
resample = cv_splits,
grid = tuning_grid,
metrics = metric_set(accuracy),
control = control_grid(save_pred = T))
Я получаю странную ошибку, когда пытаюсь вызвать tune_grid.
Fold1: model 1/1 (predictions): Error: Column `.row` must be length ....