Ошибка в xj [i]: недопустимый тип нижнего индекса 'ошибка' в случайном лесу R - PullRequest
0 голосов
/ 11 февраля 2020

My data Я использую набор данных airbnb. После очистки я попытался применить случайный лес (я сделал дерево и обрезанное дерево, и они работали). У меня нет большого опыта, но вот мой код:

split_index <- createDataPartition(airbnbcleanedfinal$logprice, p = 0.8, list = F)

#Use index to split data
training<-training <- airbnbcleanedfinal[split_index,]
training1 <- airbnbcleanedfinal[sample(nrow(airbnbcleanedfinal),100000,replace=TRUE),]
features_test <- airbnbcleanedfinal[-split_index, !(colnames(airbnbcleanedfinal) %in% c('logprice'))]
target_test <- airbnbcleanedfinal[-split_index, 'logprice']

library(randomForest)


rf_train <- randomForest(logprice ~ ., data = airbnbcleanedfinal,
                         subset=training,
                         mtry = 5)

Но я всегда получаю одно и то же сообщение об ошибке:

Ошибка в xj [i]: недействительно подстрочный тип 'list'

Я также пытался удалить subset = training и поместить непосредственно data = training, но это заставляет R работать вечно. Я также пытался использовать training1, который я создал для этой цели, но все равно получал то же сообщение об ошибке.

Я пробовал unlist (training), но он не работал. Мои данные тоже огромны (85k-15 переменных), может в этом проблема? Как я могу заставить тренировки быть списком?

...