Спарклыр | Проблема мультиклассовой логистической регрессии
Мы пытались вписать мультиклассовую модель логистической регрессии в sparklyr. Набор данных использовал «mtcars», целевой переменной, которую мы пытались предсказать, является «gear», который имеет 3 класса, метод «ml_logistic_regression» выдал следующую ошибку «Ошибка: java.lang.IllegalArgumentException: недопустимый метод areaUnderROC для объекта 281» Код отлично работает для целевой переменной «am», которая имеет 2 класса
sc <- spark_connect (master = "yarn-client", версия = spark_version, config = config, spark_home = spark_home) </p>
Преобразование набора данных mtcars в фрейм данных Spark
mtcars_tbl <- sdf_copy_to (sc, mtcars, name = "mtcars_tbl", перезаписать = TRUE) </p>
Подгонка бинарной логистической регрессии. «am» - двоичная переменная
lr_model <- mtcars_tbl%>% ml_logistic_regression (am ~ gear + carb)
Поиск: код успешно выполнен
Подгонка мультиклассовой логистической регрессии. «gear» имеет 3 уникальных значения
lr_model <- mtcars_tbl%>% ml_logistic_regression (gear ~ am + carb, family = 'multinomial')
Поиск: выдает ошибку