Я получаю предупреждение в RI не понимаю - PullRequest
1 голос
/ 16 февраля 2020

** Когда я тренирую свои модели SVM, я получаю это предупреждающее сообщение:

Предупреждающее сообщение: In .local (x, ...): Variable (s) `'constant. Невозможно масштабировать данные.

Может ли кто-нибудь пролить свет на это предупреждение? Это то, что меня должно беспокоить? Я думал о предупреждении, возможно, из-за моего фиктивного кодирования переменных, которое я сделал Если так, кто-нибудь знает способ обойти это предупреждение? Спасибо за все время! **

# importing libraries
library(tidyverse)
library(caret)

# importing the data and changing data types ----
loan <- read_csv("loan_data.csv", col_types = cols(
    credit.policy    = col_factor(),
    inq.last.6mths = col_factor(),
    delinq.2yrs    = col_factor(),
    pub.rec        = col_factor(),
    not.fully.paid = col_factor(),
    purpose        = col_factor()
))

# dummy coding purpose column for SVM models
loan_dum <- loan %>% 
    fastDummies::dummy_cols(select_columns = "purpose",
                            remove_first_dummy  = TRUE,
                            remove_selected_columns = TRUE)
loan_dum %>% View()

# Checking classes of new dummy variables 
loan_dum %>% glimpse()

# Changing the data type of new dummy variables from int to factors
loan_dum <- loan_dum %>% 
    mutate(
        purpose_credit_card      = as.factor(purpose_credit_card),
        purpose_all_other        = as.factor(purpose_all_other),
        purpose_home_improvement = as.factor(purpose_home_improvement),
        purpose_small_business   = as.factor(purpose_small_business),
        purpose_major_purchase   = as.factor(purpose_major_purchase),
        purpose_educational      = as.factor(purpose_educational)
    )
loan_dum %>% glimpse()



# standardizing continuous values
loan_dum_stand <- loan_dum %>% 
    mutate(
        int.rate          = as.vector(scale(int.rate,center = TRUE,scale = TRUE)),
        installment       = as.vector(scale(installment,center = TRUE,scale = TRUE)),
        log.annual.inc    = as.vector(scale(log.annual.inc,center = TRUE,scale = TRUE)),
        dti               = as.vector(scale(dti,center = TRUE,scale = TRUE)),
        fico              = as.vector(scale(fico,center = TRUE,scale = TRUE)),
        days.with.cr.line = as.vector(scale(days.with.cr.line,center = TRUE,scale = TRUE)),
        revol.bal         = as.vector(scale(revol.bal,center = TRUE,scale = TRUE)),
        revol.util        = as.vector(scale(revol.util,center = TRUE,scale = TRUE))
    )
loan_dum_stand %>% view()


# splitting the data into train test ----
set.seed(123)
trainIndexDum <- createDataPartition(loan_dum_stand$not.fully.paid,p = 0.70,list = FALSE,times = 1)
loan_dum_train <- loan_dum_stand[trainIndexDum,]
loan_dum_test  <- loan_dum_stand[-trainIndexDum,]

loan_dum_train %>% glimpse()



#  SVM model with default settings ----
####################################################################################
# Runing model building in parallel
cl <- makePSOCKcluster(10)
registerDoParallel(cl)


# fitting svm model with radial kernel no tuning 
set.seed(123)
svm_model_radial <- train(
    form = not.fully.paid ~.,
    data = loan_dum_train,
    method = "svmRadial"
)
svm_model_radial
plot(svm_model_radial)

1 Ответ

1 голос
/ 16 февраля 2020

Эта ошибка обычно связана с тем, что в ваших тренировочных данных может быть столбец с постоянными данными (одинаковое значение в каждой строке), и поэтому, если переменная постоянна, ее нельзя масштабировать до единичной дисперсии (и нуля). имею в виду).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...