У меня 3 классификации, но мое дерево решений показывает только 2 - PullRequest
0 голосов
/ 27 ноября 2018
library(caret)
library(rpart.plot)
car_df <- read.csv("E:/SMM/TrainingDataSet (3).csv", sep = ',', header = 
TRUE)
str(car_df)

with(car_df, table( Result))



set.seed(3033)
intrain <- createDataPartition(y = car_df$Result, p= 0.7, list = FALSE)
training <- car_df[intrain,]
testing <- car_df[-intrain,]
dim(training)
dim(testing)
anyNA(car_df)
trctrl <- trainControl(method = "repeatedcv", number = 3, repeats = 2)
set.seed(3333)
dtree_fit <- train(Result ~., data = training, method = "rpart",
               parms = list(split = "gini"),
               trControl=trctrl,
               tuneLength = 10)
with(testing, table( Result))
dtree_fit

prp(dtree_fit$finalModel, box.palette = "Reds", tweak = 1.2)
testing[1,]

predict(dtree_fit, newdata = testing[1,])
test_pred <- predict(dtree_fit, newdata = testing)
confusionMatrix(test_pred, testing$Result )

CLASSIFICATION TREE

По сути, я пытаюсь классифицировать фильмы на основе положительных отрицательных и нейтральных твитов.У меня есть набор данных из 42 фильмов с 14 флопами, 13 хитами, 15 средними фильмами.

...