Я пытался построить дерево, но текст перекрывается, и хотя я пробовал разные cex, они все еще есть. Если я сделаю его меньше, то вы сможете t even read what it
примерно. Другое дело, что он показывает мне предупреждение. Я думаю, что это может быть потому, что он не может преобразовать переменные в факторы, и я не знаю, почему. Кто-нибудь может помочь? Это мой код:
cols <- c("Education", "EnvironmentSatisfaction", "JobInvolvement", "JobLevel",
"JobSatisfaction", "PerformanceRating", "RelationshipSatisfaction",
"StockOptionLevel", "TrainingTimesLastYear", "WorkLifeBalance")
df[cols] <- lapply(df[cols], factor)
shuffle_index <- sample(1:nrow(df1))
df2 <- df
create_train_test <- function(df2, size = 0.8, train = TRUE) {
n_row = nrow(df2)
total_row = size * n_row
train_sample <- 1: total_row
if (train == TRUE) {
return (df2[train_sample, ])
} else {
return (df2[-train_sample, ])}}
data_train <- create_train_test(df2, 0.8, train = TRUE)
data_test <- create_train_test(df2, 0.8, train = FALSE)
dim(data_train)
dim(data_test)```
`#use the function prop.table() combined with table() to verify if the randomization process is correct.
prop.table(table(data_train$Attrition))
prop.table(table(data_test$Attrition))`
`fit <- rpart(Attrition~., data = data_train, method = 'class')
rpart.plot(fit, extra = 106, cex = 0.45)`