Это код, который я использую, и он не возвращает дерево, и я не могу понять, почему.
library(C50)
library(pROC)
project <- read.csv("project.csv")
project$AOI1 <- as.factor(project$AOI1)
project$AOI2 <- as.factor(project$AOI2)
project$LGT_COND <- as.factor(project$LGT_COND)
project$WEATHER <- as.factor(project$WEATHER)
project$BODY_TYP <- as.factor(project$BODY_TYP)
project$FATALS <- as.factor(project$FATALS)
project$DRUNK_DR <- as.factor(project$DRUNK_DR)
size <- floor(0.8 * nrow(project))
training_index <- sample(nrow(project), size = size, replace = FALSE)
train <- project[training_index,]
test <- project[-training_index,]
var_names <- names(project)[-7]
dt <- C5.0(x = train[, var_names], y = train$DRUNK_DR)
summary(dt)
и возвращает его по какой-то причине, он видит только DRUNK_DR и ничего больше.
Call:
C5.0.default (x = train [, var_names], y = train $ DRUNK_DR)
C5.0 [Выпуск 2.07 GPL Edition] Ср 6 марта 16:42:15 2019
-------------------------------
Класс, определенный атрибутом `result '
Считать 25732 случая (8 атрибутов) из undefined.data
Дерево решений:
0 (25732/7068)
Evaluation on training data (25732 cases):
Decision Tree
----------------
Size Errors
1 7068(27.5%) <<
(a) (b) (c) (d) <-classified as
---- ---- ---- ----
18664 (a): class 0
6870 (b): class 1
196 (c): class 2
2 (d): class 3
Есть идеи?