Я получаю больше значений прогноза в случайном лесу, чем новые данные, предоставленные ему? - PullRequest
0 голосов
/ 08 октября 2019

Я пытаюсь решить упражнения ISLR. Во время одного упражнения в случайном лесу, когда я пытаюсь предсказать значения на основе набора данных тренировки. Я получаю больше значений прогноза, чем предоставленных новых данных.

  • Всего строк в наборе данных = 506
  • Строк, используемых в обучающем наборе = 300
  • Строк, используемых в тестеset = 206

Я использую функцию predict() для получения прогнозов для нового набора данных.

train = sample(1:nrow(Boston),300) 
rf.p = randomForest(medv~., data= Boston, subset= train, mtry = dim(Boston)[2]-1) 
pred.p = predict(rf.p, newdata = Boston[-train,]) 

Я ожидал, что длина pred.p будет равна 206 как длина Boston[-train,], но я получаю pred.p как вектор длины 503.

...