Я использую набор данных airbnb. После очистки я попытался применить случайный лес (я сделал дерево и обрезанное дерево, и они работали). У меня нет большого опыта, но вот мой код:
split_index <- createDataPartition(airbnbcleanedfinal$logprice, p = 0.8, list = F)
#Use index to split data
training<-training <- airbnbcleanedfinal[split_index,]
training1 <- airbnbcleanedfinal[sample(nrow(airbnbcleanedfinal),100000,replace=TRUE),]
features_test <- airbnbcleanedfinal[-split_index, !(colnames(airbnbcleanedfinal) %in% c('logprice'))]
target_test <- airbnbcleanedfinal[-split_index, 'logprice']
library(randomForest)
rf_train <- randomForest(logprice ~ ., data = airbnbcleanedfinal,
subset=training,
mtry = 5)
Но я всегда получаю одно и то же сообщение об ошибке:
Ошибка в xj [i]: недействительно подстрочный тип 'list'
Я также пытался удалить subset = training и поместить непосредственно data = training, но это заставляет R работать вечно. Я также пытался использовать training1, который я создал для этой цели, но все равно получал то же сообщение об ошибке.
Я пробовал unlist (training), но он не работал. Мои данные тоже огромны (85k-15 переменных), может в этом проблема? Как я могу заставить тренировки быть списком?