ошибка создания формулы sparklyr - PullRequest
0 голосов
/ 07 мая 2018

Я тестирую этот урок

Прогнозирование пищевых предпочтений с помощью sparklyr (машинное обучение)

но в разделе Моделирование я получаю следующую ошибку

Введите код:

library(lazyeval)
for (response in countries) {

  features <- colnames(partitions$training)[-grep(response, colnames(partitions$training))]
  features <- features[grep("_trans|_idx", features)]

  fit <- partitions$training %>%
    filter_(interp(~ var > 0, var = as.name(response))) %>%
    ml_random_forest(intercept = FALSE, response = response, features = features, type = "classification")

...
}

Выход:

Error in ml_formula_transformation(): only one of 'formula' or 'response'-'features' should be specified
Traceback:

1. partitions$training %>% filter_(interp(~var > 0, var = as.name(response))) %>% 
 .     ml_random_forest(intercept = FALSE, response = response, 
 .         features = features, type = "classification")
2. withVisible(eval(quote(`_fseq`(`_lhs`)), env, env))
3. eval(quote(`_fseq`(`_lhs`)), env, env)
4. eval(quote(`_fseq`(`_lhs`)), env, env)
5. `_fseq`(`_lhs`)
6. freduce(value, `_function_list`)
7. withVisible(function_list[[k]](value))
8. function_list[[k]](value)
9. ml_random_forest(., intercept = FALSE, response = response, features = features, type = "classification")

Я пытался создать формулу, однако ответ - это переменная, и его следует оценивать лениво, поскольку эта функция является содержимым переменной ответа (пример страны Алжир)

IN

ml_formula <- formula(response ~ features)


  fit <- partitions$training %>%
    filter_(interp(~ var > 0, var = as.name(response))) %>%
  ml_random_forest(ml_formula, type = "classification")

из

Error in ml_random_forest(., ml_formula, type = "classification"): response is not a column in the input dataset

заранее спасибо

...