Как исключить определенные переменные из рецепта? - PullRequest
0 голосов
/ 03 сентября 2018

При использовании функции step_regex для создания рецепта для модели создаются дополнительные столбцы для определенных шаблонов в исходном столбце. Есть ли способ исключить исходный столбец из рецепта, как только я закончу с ним?

Например, в приведенном ниже примере продукт содержит как исходный столбец description, так и два новых, созданных step_regex. Мне нужно решение, интегрированное с объектом recipe, чтобы я мог использовать его непосредственно в caret::train.

library(recipe)
data(covers)

rec <- recipe(~ description, covers) %>%
  step_regex(description, pattern = "(rock|stony)", result = "rocks") %>%
  step_regex(description, pattern = "ratake families")

rec2 <- prep(rec, training = covers)

with_dummies <- bake(rec2, newdata = covers)

1 Ответ

0 голосов
/ 03 сентября 2018

Только что нашел решение. Я думаю, что могу изменить роль столбцов, которые я не хочу использовать в качестве предикторов.

rec <- rec %>% add_role(description, new_role = "dont_use")

...