Я работаю с пакетом C50 и не могу выполнить алгоритм, на данный момент две основные вещи: набор данных без нулей и коэффициент для переменной 'credit $ default'.Мне интересно, что не так.
Сообщение после выполнения этого кода:
c50 code called exit with value 1
Код:
library(gmodels)
library(readr)
library(dplyr)
library(class)
library(C50)
# Step 1: Get the data
url_data <- "https://raw.githubusercontent.com/pakinja/Data-R-Value/master/MachineLearning_C5.0_Classification_Algorithm/credit.csv"
credit <- read_csv(url(url_data))
# Step 2: Exploring and preparing the data
credit$default[credit$default == 1] <- "no"
credit$default[credit$default == 2] <- "yes"
credit$default <- as.factor(credit$default)
# Creating Random test
set.seed(123)
train_sample <- sample(1000,900)
str(train_sample)
credit_train <- credit[train_sample,]
credit_test <- credit[-train_sample,]
prop.table(table(credit_test$default))
prop.table(table(credit_train$default))
# Step 3: Training a model on the data
credit_model <- C5.0(credit_train[,-17], credit_train$default, trials = 1,
rules = FALSE)
summary(credit_model)