Результаты прогноза для двух переменных ответа из случайного леса - PullRequest
0 голосов
/ 06 декабря 2018

Вместо того, чтобы моделировать функцию как процесс ARIMA, я пытаюсь использовать случайные леса и повышение градиента в качестве методов регрессии.В настройке задачи предикторами являются t_2 и t_1, а прогнозируемой переменной является t.Использование периода с января 1974 года по декабрь 1978 года в качестве тренировочного набора и использование 1979 года в качестве тестового набора.Я пытаюсь создать модель случайного леса в R, но я застрял в следующей части, где я получаю число переменных, которые пробуются при каждом разделении: 1, а иногда OOB составляет 100%.Может ли кто-нибудь помочь мне?Заранее спасибо

library(randomForest)
library(caret)
library(e1071)
library(ranger)
#converting ldeath timeseries to vector
ldeathsVector <- as.vector(ldeaths)
#dividing the vectors into 3 vectors 
t_2<- ldeathsVector[1:70]
t_1<- ldeathsVector[2:71]
t<-ldeathsVector[3:72]
ldeathDataFrame <- data.frame(t_2=t_2,t_1 =t_1,t=t)
ldeathTraining <- ldeathDataFrame[1:58,]
ldeathTesting <- ldeathDataFrame[59:70,]
ldeathTraining <- ldeathTraining[complete.cases(ldeathTraining),]
ldeathTesting <- ldeathTraining[complete.cases(ldeathTesting),]
formula <- paste(t, "~", paste(t_1, t_2 = " + "))
ldeathRandomForest <- randomForest(t ~ t_1+t_2, 
                         ldeathTraining, 
                         num.trees = 510,importance = TRUE)
...