Сгруппированный Dataframe при использовании со случайным лесом выдает «Ошибка в eval (predvars, data, env): объект 'AuctionType_Engli sh Нет связей' не найден" » - PullRequest
0 голосов
/ 11 марта 2020

У меня есть сгруппированный фрейм данных (df2), в котором присутствуют 2 столбца:

subcategory  data
------------|---- 
8123          36 variables
8231          36 variables
4251          36 variables
5323          36 variables and so on.

Я использовал следующий фрагмент кода для преобразования фрейма данных в вышеупомянутый формат:

df5=df2[,-c(2,32,33)] %>%
  group_by(SubCategory_ID)%>%
  nest()

Здесь Дата и 2 других столбца с факторными переменными опущены.

Затем я выполняю случайный лес для сгруппированного фрейма данных:

df6=df5%>%
  mutate(fit = map(data, ~ randomForest(WinningPrice ~ ., data = .,
                                        importance = TRUE,
                                        ntree = 100)),
         importance = map(fit, imp_df)) %>% 
  # Unnesting and plotting
  unnest(importance)

Этот код работает отлично. Выходные данные генерируются, но модель пропускает фактор-переменные.

Но тот же код, если я выполняю без пропуска факторных переменных (которые преобразуются в фиктивные переменные), тогда я получаю следующую ошибку:

"Error in eval(predvars, data, env) : 
  object 'AuctionType_English No Ties' not found"
...