Я тестирую этот урок
Прогнозирование пищевых предпочтений с помощью sparklyr (машинное обучение)
но в разделе Моделирование я получаю следующую ошибку
Введите код:
library(lazyeval)
for (response in countries) {
features <- colnames(partitions$training)[-grep(response, colnames(partitions$training))]
features <- features[grep("_trans|_idx", features)]
fit <- partitions$training %>%
filter_(interp(~ var > 0, var = as.name(response))) %>%
ml_random_forest(intercept = FALSE, response = response, features = features, type = "classification")
...
}
Выход:
Error in ml_formula_transformation(): only one of 'formula' or 'response'-'features' should be specified
Traceback:
1. partitions$training %>% filter_(interp(~var > 0, var = as.name(response))) %>%
. ml_random_forest(intercept = FALSE, response = response,
. features = features, type = "classification")
2. withVisible(eval(quote(`_fseq`(`_lhs`)), env, env))
3. eval(quote(`_fseq`(`_lhs`)), env, env)
4. eval(quote(`_fseq`(`_lhs`)), env, env)
5. `_fseq`(`_lhs`)
6. freduce(value, `_function_list`)
7. withVisible(function_list[[k]](value))
8. function_list[[k]](value)
9. ml_random_forest(., intercept = FALSE, response = response, features = features, type = "classification")
Я пытался создать формулу, однако ответ - это переменная, и его следует оценивать лениво, поскольку эта функция является содержимым переменной ответа (пример страны Алжир)
IN
ml_formula <- formula(response ~ features)
fit <- partitions$training %>%
filter_(interp(~ var > 0, var = as.name(response))) %>%
ml_random_forest(ml_formula, type = "classification")
из
Error in ml_random_forest(., ml_formula, type = "classification"): response is not a column in the input dataset
заранее спасибо