У меня есть сгруппированный фрейм данных (df2), в котором присутствуют 2 столбца:
subcategory data
------------|----
8123 36 variables
8231 36 variables
4251 36 variables
5323 36 variables and so on.
Я использовал следующий фрагмент кода для преобразования фрейма данных в вышеупомянутый формат:
df5=df2[,-c(2,32,33)] %>%
group_by(SubCategory_ID)%>%
nest()
Здесь Дата и 2 других столбца с факторными переменными опущены.
Затем я выполняю случайный лес для сгруппированного фрейма данных:
df6=df5%>%
mutate(fit = map(data, ~ randomForest(WinningPrice ~ ., data = .,
importance = TRUE,
ntree = 100)),
importance = map(fit, imp_df)) %>%
# Unnesting and plotting
unnest(importance)
Этот код работает отлично. Выходные данные генерируются, но модель пропускает фактор-переменные.
Но тот же код, если я выполняю без пропуска факторных переменных (которые преобразуются в фиктивные переменные), тогда я получаю следующую ошибку:
"Error in eval(predvars, data, env) :
object 'AuctionType_English No Ties' not found"