Случайное лесное дерево для классификации - PullRequest
1 голос
/ 01 мая 2020

str(data1) Я пробую RF в первый раз. Я пытаюсь предсказать жанр игры, основываясь на факторах

data <- read.csv("appstore_games.csv")
data <- data %>% drop_na()
data <- data %>% select(Average.User.Rating, User.Rating.Count, Price, Age.Rating, Genres)
data <- data %>% separate(Genres, c("Main Genre","Genre1","Genre2","Genre3"), extra = "drop" )
data1 <- data %>% select(Genre1 , Average.User.Rating, User.Rating.Count, Price )
str(data1)
data1$Genre1 <- as.factor(data1$Genre1)
set.seed(123)
sample <- sample(2 , nrow(data1),replace = TRUE, prob = c(0.7,0.3))
train_data <- data1[sample == 1,]
test_data <- data1[sample == 2,]
library(randomForest)
set.seed(1)
rf <- randomForest(train_data$Genre1 ~., data = train_data , proximity = TRUE, ntree = 200, importance = TRUE)

В этот момент отображается ошибка Ошибка в randomForest.default (m, y, ...): не может быть пустых классов в г.

Могу я узнать, что здесь не так? Спасибо В жанре есть такие названия, как Стратегия, Развлечения и др. c

Ответы [ 2 ]

2 голосов
/ 06 мая 2020

train_data <- droplevels (train_data) Попробуйте использовать это, прежде чем передавать данные в модель </p>

2 голосов
/ 01 мая 2020

Я не совсем уверен, но я думаю, что это могло бы произойти, если бы не все различные уровни вашего Y были представлены в данных поезда. Может быть, вы проверите это.

Моя другая идея заключается в том, что один из ваших классов в Y - "Нет".

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...